BTC$29880

ETH$3666

Шукати

Підхід глибокого навчання, розроблений для створення реалістичних пташиних пісень для біологів та екологів

Розвиток глибокого навчання справив глибокий вплив на різні сфери, і одним з інтригуючих застосувань є його роль у моніторингу рідкісних птахів за їхніми піснями. Хоча програмне забезпечення для ідентифікації зробило розрізнення звичайних видів птахів більш доступним, воно стикається з проблемами, коли йдеться про незнайомі або недостатньо представлені види. Щоб вирішити цю проблему, дослідники з канадського Університету Монктону розробили ECOGEN — інструмент, який генерує реалістичні звуки птахів, щоб доповнити зразки рідкісних або недостатньо представлених видів. Це допомагає в навчанні інструментів аудіоідентифікації, що використовуються в екологічному моніторингу.

Створення реалістичних аудіо-зразків пов’язане з певними труднощами, зокрема, з необхідністю мати значну кількість зразків для синтезу. ECOGEN вирішує цю проблему, створюючи нові зразки звуків птахів, розширюючи звукові бібліотеки для видів з обмеженою кількістю записів без необхідності проведення додаткових польових робіт або заподіяння шкоди тваринам. Інструмент використовує представлення форми хвилі, зберігаючи цілісність інформації без втрат, для створення високоякісних аудіо-зразків.

В експериментах додавання синтетичних зразків пташиних пісень, згенерованих ECOGEN, покращило точність класифікації пташиних пісень в середньому на 12% в ідентифікаторі пташиних пісень. Дослідники на чолі з доктором Ніколя Лекомтом підкреслили нагальну потребу в автоматизованих інструментах, таких як акустичний моніторинг, для відстеження змін біорізноманіття, спричинених глобальними коливаннями популяцій тварин. Однак багатьом моделям штучного інтелекту бракує вичерпних довідкових бібліотек для ідентифікації видів в акустичному моніторингу.

Різні представлення аудіосигналів записів пісень американської бурокрилої крячки (Pluvialis dominica). (a) Зображення американської золотистої ржанки (NL). (b-e) – форма звукового сигналу, спектрограма Мела, частота CQT та представлення пісні ржанки за допомогою Chroma Shift, що відображають її пісню, відповідно. Джерело

Дослідники підкреслили, що синтетичні пташині пісні можуть сприяти збереженню зникаючих видів птахів і надавати цінну інформацію про їхні голоси, поведінку та вподобання щодо середовища проживання. Доктор Лекомт зазначив, що хоча ECOGEN був розроблений для птахів, він потенційно може бути застосований і до інших тварин, таких як ссавці, риби, комахи та амфібії.

ECOGEN працює шляхом перетворення записів пташиних пісень у спектрограми — візуальні зображення звуків. Потім на основі цих спектрограм він створює нові зображення зі штучним інтелектом, поповнюючи набори даних про рідкісні види. Ці згенеровані спектрограми конвертуються назад в аудіоформат для навчання моделей звукової ідентифікації птахів. У своєму дослідженні дослідники використовували набір даних з 23 784 записів диких птахів 264 різних видів з усього світу.