Нейросеть помогла создать полезный продукт из «голоса» кашалотов
Ученые из Санкт-Петербурга обучили нейросеть на основе «песен» кашалотов генерировать звуки, перспективные для систем подводной связи. Кроме того, разработанный инструмент поможет в исследовании этих животных, отмечают специалисты.
Работу выполнили сотрудники Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» имени В.И. Ульянова (Ленина).
Исследование звуков, издаваемых морскими млекопитающими, может пригодиться в разных направлениях, отмечают специалисты. Так, излучение звуковых волн и интерпретация отраженных сигналов позволит разработать более эффективные системы подводной связи и навигации, гидролокаторов. А понимание, как шумы влияют на передачу звука, поможет создать способы, минимизирующие влияние помех на подводные коммуникации, сообщили Fishnews в пресс-службе университета.
Кроме того, исследования голосовых сигналов, например, кашалотов, позволяют биологам классифицировать отдельные типы по их диалогу. Это помогает распознать, кто из животных исполняет те или иные «песни». Многие ученые считают, что кашалоты используют щелчки, трески и стоны для общения, эхолокации и ориентации в пространстве.
Однако некоторые из существующих баз данных являются закрытыми, а для изучения кашалотов и издаваемых ими звуков необходимо большое количество «голосовых» записей. Поэтому специалисты разрабатывают методы, которые позволят создавать достаточно похожие по характеристикам звуки морских млекопитающих при помощи уже имеющихся данных.
«Нами разработан метод генерации синтетических звуков, а именно щелчков кашалотов, с помощью нейросети. Для этого «песни» этих млекопитающих животных мы преобразовали в картинки, представив их в виде спектрограммы, а затем с помощью специального алгоритма машинного обучения для генерации изображений сгенерировали новые наборы звуков», — рассказала доцент кафедры систем автоматизированного проектирования (САПР), старший научный сотрудник Молодежного научно-исследовательского института (МолНИИ) СПбГЭТУ «ЛЭТИ» Екатерина Копец.
Она обратила внимание, что полученные данные будут полезны не только в морской биологии, но и при усовершенствовании методов подводной связи на основе акустических сигналов.
Исследователи получили щелчки определенного кашалота из открытых баз данных звуков морских млекопитающих. Затем они занимались обработкой и искажением сигналов без влияния на исходные материалы — меняли тембр, тон, добавляли случайный шум, ускоряли и замедляли звук.
После преобразования голосовых данных в спектрограммы, картинки вертикально и горизонтально «нарезались» и переставлялись местами. Это позволило получить новые наборы звуков без преобразования их структуры. После этого готовая архитектура была усовершенствована таким образом, чтобы она могла генерировать звуки с частотой свыше 20 кГц.
«Усовершенствованную модель мы обучили самостоятельно выполнять все нужные шаги для получения новых наборов данных и также их классифицировать. Результатом стала нейросеть, которая может работать с высокочастотными сигналами и выдавать очень похожие щелчки определенного кашалота — с 10-12% отклонением от метрик», — отметила Екатерина Копец.
По словам специалиста, в перспективе такой метод можно использовать для генерации звуков любого животного, например птиц. Для этого будет необходимо настроить алгоритм на обработку их голосовых данных.
Результаты исследований по генерации синтетических голосовых данных с использованием StyleGAN2-ADA представлены в научном журнале Big data and cognitive computing. Работа поддержана Российским научным фондом.
Читайте также: «Пение китов» может помочь рыбакам
Больше новостей читайте в телеграм-канале Fishnews.
Fishnews