Машинное зрение, искусственный интеллект и ограничения внутри

01.08.2019
Cерийная

В недавней статье были рассмотрены проблемы, которые возникают у алгоритмов глубокого обучения при классификации изображений. Основным открытием было то, что эти нейронные сети подчеркивают текстуру поверхности по сравнению с обнаружением краев, то есть формы объекта. Основная причина заключается в том, что эти текстуры содержат на порядок больше информации, чем края, таким образом, данные текстуры доминируют в алгоритмах обучения. Результат дает много свободы для камуфляжа: очертания самолета окрашены с перекрывающимися часами лица были неправильно помечены как часы, как кошка окрашены с текстурой кожи слона был неправильно помечены как слон.

Для классификации изображений алгоритмы глубокого обучения обучаются тысячам изображений, которые либо содержат, либо не содержат испрашиваемых элементов, таких как кошка. Алгоритм учится находить шаблоны, которые он затем использует для обозначения изображений, которых он никогда не видел раньше. Затем исследователи улучшили алгоритмы обучения, разделив изображения на патчи, которые были проанализированы индивидуально.

«Архитектура нейронных сетей позволяет интегрировать различные функции для принятия решений. Однако это не происходит автоматически. Устранение нежелательных глубоко укоренившихся предубеждений возможно, если не легко».

Это наводит на ум, как работает человеческая зрительная система. Оставляя различия в фотосенсорах и обработке изображений, происходящих там, наш мозг не работает как единая нейронная сеть, анализирующая изображения, предоставляемые двумя глазами. Данные делятся и изображение анализируется в различных областях мозга для различных особенностей: обнаружения движения, обнаружения края, ведущих к распознаванию формы, распознавание цветового оттенка и т.д. Вся эта информация также сравнивается и сливается со зрительной памятью. Большинство из того, что мы думаем, мы видим на самом деле напомнил из памяти, наше зрение является резким (как мы это чувствуем) только в fovea сетчатки – зондирование целевого места мы сосредоточены на. Там могут быть веские причины, что эволюция разделила процесс на различные блоки.

Текстура, конечно, влияет и на людей. Камуфляжная живопись и одежда были использованы для того, чтобы разогнать форму кораблей или солдат, чтобы визуально затруднить их обнаружение. Для более простых визуальных систем насекомых, более простые средства, кажется, работают: полосатые текстуры зебры было установлено, нарушить зрение слепень. Когда они подойдут достаточно близко к на зебре, они не смогут найти поверхность и либо пролететь мимо, либо соскочить на поверхность, не имея возможности приземлиться. Это было доказано путем одевать людей и лошадей с прокладками зебры.

Checker shadow illusion

Иллюзия шахматной тени. Хотя квадрат A выглядит более темным оттенком серого, чем квадрат B, на изображении они имеют точно такую же яркость. Источник: Wikipedia. Оригинал: Эдвард Х. Адельсон (Edward H. Adelson), векторизованный Pbroks13. 

 

Сложная работа зрительной системы человека вызвала некоторые проблемы в индустрии производства дисплеев. Около двадцати лет назад отрасль перешла от дисплеев CRT к плоским панелям, таким как LCD или OLED. Контроль качества поверхности дисплея CRT был относительно простым, в то время как в плоских панелях все пиксели в основном являются отдельными объектами. Использование новых технологий цифровой фотографии были вопросы, тоже, как возможные вопросы качества, такие как оптические иллюзии не были записаны со стандартными камерами визуального осмотра. Камеры и программное обеспечение для обработки изображений должны были имитировать человеческую зрительную систему, чтобы иметь возможность видеть проблемы качества (например, Grid Illusion), которые могут вызвать головную боль у человека.

Однако большинство процессов визуального осмотра, требуемых при контроле качества, имеют более простой характер. В фармацевтической промышленности примерами являются проверка количества таблеток в полосах волдырей, качества печатных кодов сериализации в упаковках или бутылках, а также читаемость информации о дате истечения срока годности. Медицинские устройства также имеют коды, цифры и весы, читаемость которых должна быть проверена. Поскольку контекст хорошо определен, система машинного зрения требуется только для измерения, если качество печати соответствует требуемым стандартам. Можно, однако, найти больше пользы для визуальных данных инспекции, таких как использование шума, присущего процессу печати в качестве уникального отпечатка пальца, добавив надежность против фальсификации и вредоносных атак кода QR.

Servicepoint предлагает услуги опытной компании по сборке и упаковке полнофункциональных устройств, контролю зрения и качества машин, робототехнике, а также по интеграции автоматизации сериализации и отслеживания. Позвоните нам, мы можем вам помочь!

Servicepoint Oy — надежный партнер для обрабатывающей промышленности

Iiro Jantunen,
Ииро Янтунен

Техн. директор
Servicepoint Kuopio Oy
iiro.jantunen@servicepoint.fi