Использование технологии обработки больших данных для анализа изображений и видео превосходит способности человеческого мозга

Улучшение дорожной безопасности, услуг здравоохранения и окружающей среды – вот те немногие сферы возможного применения технологии усовершенствованного распознавания и анализа изображений. Big data technology «Усовершенствованное распознавание изображений с помощью компьютера является результатом большой кропотливой работы. Нам необходимо сымитировать способ, с помощью которого человеческий мозг классифицирует информацию на полезную и бесполезную», - говорит Айрик Торснес из компании Uni Research в Бергене (Новрегия). Торснес возглавляет группу в Центре обработки больших данных этой компании, которая разрабатывает стратегии использования больших данных в исследовательских и коммерческих целей. Центр также занимается разработкой улучшенных компьютерных технологий, работающих аналогично человеческому мозгу.

Во многих областях фантастическая емкость и методы работы человеческого мозга будут и впредь превосходить компьютеры, но существуют несколько сфер, где компьютеры выполняют работу лучше.

«В последние годы проведена огромная работа, и мы в настоящее время опередили человеческий «предел» в вопросах распознавания изображений и их анализа. В конце концов компьютеры никогда не устают при просмотре почти идентичных изображений и смогут зафиксировать даже самые незначительные нюансы, которые человек увидеть просто не в состоянии. Если удастся анализировать с помощью компьютера большой объем изображений и видеоматериалов, множество процессов в жизни общества может быть улучшено и оптимизировано», - объясняет Торснес.

Торснес и его коллеги из Центра анализа больших данных предсказывают, что распознавание изображений и их последующий анализ станут достаточно важными в таких областях как здравоохранение, мониторинг окружающей среды, обзор и анализ спутниковых снимков загрязнения морского дна.

Использование больших данных при распознавании и анализе изображений требует совместной работы хорошего аппаратного обеспечения, алгоритмов и программного обеспечения, а также персонал, который отвечает за принятие решения. «Необходимость подобной технологии будет только усиливаться, но она не является технологией типа «подключил и играй»(Plug’n’Play). Наши исследователи разработали специальный алгоритм обработки большого количества информации и методы его применения», - говорит Торснес.

Исследователи департамента Uni Research Computing разработали компьютерную систему, которая способна распознавать объекты и определять, какие из них являются важными.

Алла Сапронова, являющаяся экспертом в области искусственного интеллекта, распознавания изображений и машинного обучения, объясняет: «Я тренирую компьютер также, как мы учим детей. Я показываю компьютеру образцы входных сигналов и говорю, каким должен быть выходной сигнал. Я повторяю этот процесс до тех пор, пока система не начнет распознавать эти образцы. Затем я показываю компьютеру входной сигнал, например картинку, которую он еще «не видел» и тестирую систему на предмет того, как она поймет эту картинку».

Например, этот способ машинного обучения показал свою эффективность при разработке технологии распознавания улыбки для камер мобильных телефонов.

«Мы запустили пилотный проект совместно с GAMUT по анализу видеозаписей детей, болеющих аутизмом и проходящих музыкальную терапию. Обычно терапевтам необходимы потратить не один час времени для просмотра видеозаписи с целью идентификации конкретных моментов, которые наилучшим образом показывают статус или прогресс пациента. Однако если мы обучим компьютер, на каких моментах записи следует обратить внимание, он будет в состоянии сам найти и отметить их. Существует одна проблема - современные компьютеры не могут классифицировать эти изображения, что является предметом для дальнейших исследований», - говорит Торснес.

В другом проекте исследователи использовали публично доступные записи с веб-камер, установленных на самом оживленном перекрестке в Бергене – Danmarksplass, для обучения компьютеров регистрировать количество и типы машин, проехавших через него в течение дня.

Это информация позволяет идентифицировать шаблоны дорожной обстановки, которые могут использоваться при планировании и принятии решений по ее управлению. Единственным препятствием по использованию таких изображений исследователь считает плохие погодные условия (снег зимой), при которых качество изображения ухудшается.

Однако, он верит, что в настоящее время анализ изображений имеет огромный потенциал в области улучшения дорожной безопасности, например при мониторинге определенных участков дорог или туннелей. Компьютеры могут определить ряд различных ситуаций, включая автомобили, едущие по встречной полосе, возгорания, дорожно-транспортные происшествия, сломанные автомобили, нахождение людей в тоннелях и многое другое.

«Также является возможным обеспечить компьютерный мониторинг склонов, подверженных оползням, вдоль дорог и обучить компьютеры распознавать, какие изменения поверхности земли могут вызвать повышенный риск оползня», - говорит Торснес.

Исследователи Uni Research Computing и Центра анализа больших данных, возглавляемые Клаусом Йохансоном, работают над проектом отображения движения лосося и форели в устье реки с использованием технологии распознавания и анализа изображений. Эта работа проделана во взаимодействии с другим департаментом компании - Uni Research Environment.

«Камера была установлена в устье реки и компьютер был обучен определять тип проплывающей рыбы: была это дикая рыба или рыба, плывшая с фермы. В результате мы можем следить, в том числе, за уровнем популяции рыбы на рыбных фермах», - говорит Торснес.

Одной из причин, почему технология определения получила такое применение в последние годы, является то, что Торснес осуществил вернулся к применению алгоритмов искусственного интеллекта.

Учитывая потребности промышленности и применяя некоторые старые идеи создания искусственного интеллекта на современных образцах компьютерной техники и современных графических процессорах (развитых благодаря игровой индустрии), стало возможным использование описанной выше технологии для эффективного анализа изображений. «Традиционно такой анализ осуществлялся людьми, которые часами сидели и просматривали видеоматериалы, например медицинское исследование или мониторинг дорожного движения в туннеле», - говорит Торснес.

В настоящее время мы имеем достаточно компьютерной мощности и общедоступной информации для обеспечения более углубленного обучения компьютеров по распознаванию и анализу изображений и видеоматериалов.

Назад

Не менее интересно