«Для генерации звуков любого животного»: российские специалисты научили нейросеть говорить на языке кашалотов

Российские учёные из СПбГЭТУ «ЛЭТИ» разделили «речь» кашалотов на отдельные звуки, а затем научили нейросеть строить из них новые сигналы. Эти «слова» очень похожи на те, что издают морские млекопитающие. При этом нейросеть способна даже имитировать индивидуальные особенности «речи» определённого животного. Разработка поможет биологам в классификации кашалотов и их популяций. Кроме того, учёные не исключили, что благодаря этой технологии можно будет обучить ИИ генерировать звуки любого другого животного.

Учёные из СПбГЭТУ «ЛЭТИ» научили нейросеть синтезировать «речь» кашалотов — воспроизводить звуки, аналогичные тем, которые издают эти морские млекопитающие. Разработка поможет биологам лучше разобраться в том, как именно общаются между собой киты. Об этом RT сообщили в пресс-службе университета. Результаты научного исследования опубликованы в журнале Big Data and Cognitive Computing.

Реальные записи голосов китов авторы работы преобразовали в спектрограммы — фотографические изображения спектра волн. А затем разделили их на фрагменты, подобные отдельным звукам человеческой речи. Из этих «кирпичиков» компьютерная программа уже формирует новые наборы сигналов в ультразвуковом диапазоне. Причём ИИ способен имитировать индивидуальные речевые особенности отдельных животных.

«Результатом стала нейросеть, которая может работать с высокочастотными сигналами и выдавать очень похожие щелчки определённого кашалота — с 10—12%-ным отклонением от метрик. В перспективе данный метод можно использовать для генерации звуков любого животного, например птиц. Для этого необходимо будет настроить алгоритм на обработку их голосовых данных», — пояснила RT доцент кафедры систем автоматизированного проектирования (САПР), старший научный сотрудник Молодёжного научно-исследовательского института (МолНИИ) СПбГЭТУ «ЛЭТИ» Екатерина Копец.

Как известно, некоторые животные, включая китов, используют звуки не только для общения с себе подобными, но и для ориентирования в пространстве. Кашалоты издают особые сигналы в ультразвуковом диапазоне, а затем по скорости отражённой звуковой волны определяют расположение препятствий. Эту способность у животных обнаружили в своё время создатели подводных аппаратов — сегодня эхолокаторы применяются для навигации подлодок и других морских судов.

Новая разработка учёных поможет улучшить понимание того, как производимые китами шумы влияют на передачу звука под водой. Это в перспективе может помочь минимизировать влияние помех на подводные коммуникации.

Кроме того, изучение голосовых сигналов, например, кашалотов помогает морским биологам классифицировать отдельные популяции китов. Известно, что у каждой группы кашалотов свой язык и из-за таких различий эти животные общаются только с представителями своего клана.