Исследователи обучили компьютеры расшифровывать птичье пение

Инновационное исследование, наблюдающее за временными и частотными характеристиками птичьего пения может обеспечить новое понимание социального взаимодействия между птицами. Это также поможет обучить машины различать искусственные и естественные звуки и понимать мир вокруг нас.

Работа была возглавлена доктором Дэном Стоуэлом в Университете королевы Марии в Лондоне. Она была поддержана организацией Early Career Fellowship from the Engineering and Physical Sciences Research Council. Аудио слайд-шоу под названием: «Расшифровка утреннего хора» с содержанием образцов пения разных птиц доступна на YouTube по ссылке. В августе 2015 года технология, предложенная доктором Стоуэлом, была реализована в виде общедоступного приложения для смартфонов под названием Warblr. Пользователи записывают звук птицы на свой мобильный телефон и приложение анализирует звук, сопоставляя его с образцами, хранящимися в базе данных, и сообщает пользователю список возможных особей, которые могут издавать этот звук.

Доктор Стоуэл постоянно работает над улучшением компьютерного анализа птичьего пения для большего понимания того, какие сообщения передаются между птицами и кто является ведущим в конкретном разговоре.

«Традиционно мы применяем явные характеристики звука, такие как длительность и частота», - говорит доктор Стоуэл. «Для того, чтобы продвинуться вперед, мы использовали методы машинного обучения, при которых достоверно нельзя сказать, каким образом компьютер принял то или иное решение относительно конкретного звука. Но продолжая обучение, заключающееся в показе большого числа образцов, мы сможем разработать точный компьютерный алгоритм идентификации птичьего пения».

«Мы объединили записи голосов вместе с акустическим анализом содержания этих разговоров, например при коротком и долгом разговоре. Мы изучили такие факторы, как увеличение или уменьшение вероятности разговора одной птицы после разговора другой, или существует ли альтернативный способ взаимодействия? Работая над тем, как сильно каждая птица воздействует на другую, позволяет нам построить картину сети взаимодействия особей в группе (стае), которая используется при взаимодействии».

В дальнейшем, эти наработки могут быть использованы в различных областях от идентификации отдельных голосов и расшифровки птичьего хора до исследования влияния изменения климата на маршруты миграции птиц. Они могут также использоваться для определения эволюции изучения птичьего пения по записям, которые хранятся в Британской библиотеке. Технология также позволит улучшить наше понимание социальной организации других групп животных, в частности особенности развития человеческого языка.

«Эта технология может эффективно применяться в робототехнике. На основании образцов звуков окружающего мира (а этих звуков становится только больше) искусственный интеллект роботов (в том числе человекоподобных), позволит ему лучше анализировать и познавать окружающий мир», - говорит доктор Стоуэл.

Общественность Великобритании также сыграла важную роль в исследовании доктора Стоуэла. С момента начала его исследований, приложение Warblr собрало коллекцию в более чем 25000 записей со всей страны. При этом примерно четверть из этих записей принадлежит несуществующим птицам. Эти записи принадлежат людям, которые пытались имитировать пение птиц. Доктор Стоуэл использовал эти имитации не только для того, чтобы обучить компьютер отличать натуральное пение от поддельного, но и для формирования алгоритма демаркации пения птиц от других типов звуков, начиная от звонков мобильных телефонов и заканчивая плачем детей.

«Этот аспект использования больших данных и приобщения населения к исследованиям поможет в обучении компьютеров, компьютерному анализу источника звука», - добавляет Стоуэл. «В настоящее время существуют проекты, в которых люди используют микрофоны для записи и распознавания видов птиц в лесу. Но для того, чтобы идентифицировать пение конкретной птицы и создать некую классификацию, необходимо разработать алгоритм, который в том числе сможет с большой вероятностью ответить на вопрос «Да, это была птица…» или «Нет, это трещит дерево на ветру».

Назад

Не менее интересно