
06.10.2023 16:57
Зустрітися з проблемою обличчям
Дослідники з Технологічного інституту Шибаура революціонізували визначення напрямку обличчя за допомогою глибокого навчання: Подолання викликів, пов’язаних з прихованими рисами обличчя та розширенням кутів огляду
Машинне навчання відіграє вирішальну роль у сфері комп’ютерного зору та взаємодії людини з комп’ютером, зокрема в оцінці орієнтації обличчя. Ця технологія має широкий спектр практичного застосування, одним з яскравих прикладів якого є її інтеграція в системи моніторингу водіїв, спрямовані на підвищення безпеки дорожнього руху. Використовуючи моделі машинного навчання, ці системи можуть постійно оцінювати орієнтацію обличчя водія в режимі реального часу, гарантуючи, що його увага залишається зосередженою на дорозі, і попереджаючи його, якщо увага розсіюється через відволікаючі фактори, такі як текстові повідомлення або сонливість. Такі системи мають потенціал видавати своєчасні попередження або активувати заходи безпеки, що в кінцевому підсумку знижує ризик аварій.
Корисність оцінки орієнтації обличчя виходить за рамки безпеки дорожнього руху і знаходить застосування в різних сферах. У сфері взаємодії людини з комп’ютером вона стає потужним інструментом для відстеження погляду та аналізу виразу обличчя. Ця можливість відкриває двері до більш захоплюючого і чутливого досвіду віртуальної реальності і покращує взаємодію між користувачами і пристроями або програмними додатками. Крім того, у сфері охорони здоров’я ця технологія виявляється цінною для оцінки неврологічних станів шляхом ретельного моніторингу орієнтації голови та рухів обличчя.

Однак, щоб повною мірою використати ці можливості, необхідно вдосконалити існуючі системи оцінки орієнтації обличчя. Традиційні рішення ґрунтуються на розпізнаванні окремих рис обличчя, таких як ніс, очі та рот, і відстеженні їхніх рухів для визначення орієнтації. Однак ці традиційні методи мають обмеження, такі як конфіденційність і схильність до збоїв, коли люди носять маски або приймають несподівану орієнтацію голови.
Усвідомлюючи ці недоліки, дослідники вивчають альтернативні методи, що передбачають використання хмари точок, отриманих з датчиків глибини, для більш точної оцінки орієнтації обличчя. Незважаючи на свою багатообіцяючу перспективу, ці зусилля часто обмежувалися здатністю розпізнавати лише обмежений набір орієнтацій обличчя, що не відповідало вимогам критично важливих для безпеки додатків.
У відповідь на цей виклик дует дослідників з Технологічного інституту Сібаура в Японії розробив рішення на основі глибокого навчання. Їхній інноваційний підхід інтегрує додатковий датчик у процес навчання моделі, що дозволяє точно визначати орієнтацію обличчя за даними хмари точок. Примітно, що їхні методи досягають такого рівня точності з мінімальним набором даних.

Ця новаторська команда використовувала 3D-камеру глибини, подібно до попередніх методів, але на етапі навчання додала гіроскопічні датчики. Така інтеграція дозволила їм поєднати хмари точок, згенеровані камерою глибини, з точними даними орієнтації, отриманими від гіроскопічного датчика, прикріпленого до потилиці. Ця комбінація забезпечила послідовне і точне вимірювання горизонтального обертання голови.
Збираючи дані під різними кутами, дослідники успішно навчили високоточну модель, здатну розпізнавати ширший спектр орієнтацій обличчя, ніж традиційні методи, які зазвичай ідентифікували лише кілька положень. З подальшим збором даних система має потенціал для навчання і розпізнавання практично будь-якої мислимої орієнтації голови. Важливо, що включення гіроскопічного датчика зменшує потребу у великому наборі даних.

Під час звичайної роботи потрібна лише камера глибини, що зберігає конфіденційність, оскільки ці камери не створюють традиційних зображень. Такий підхід гарантує, що орієнтація обличчя може бути точно визначена навіть тоді, коли люди носять маски або перебувають в умовах низької освітленості.
Забігаючи наперед, дослідницька група прагне вдосконалити точність і ефективність своєї системи. Їхня кінцева мета — продемонструвати можливість її застосування на пристроях з обмеженими ресурсами, проклавши шлях до реальних застосувань, які зможуть скористатися цією революційною технологією.