25.04.2024 14:26

Остання надлегка модель ШІ від Microsoft поміщається на телефоні і може перевершити ChatGPT

Нещодавно корпорація Майкрософт представила Phi-3, останню версію сімейства малих лінгвістичних моделей (SLM), стверджуючи, що це найпотужніший і найефективніший варіант з наявних. На відміну від великих мовних моделей (LLM), які є універсальними, але ресурсномісткими, малі мовні моделі, такі як Phi-3, призначені для конкретних завдань, пов’язаних з мовою, пропонуючи ефективність і доступність.

Phi-3 Mini, що має 3,8 мільярда параметрів, навчених на 3,3 трильйонах токенів, вирізняється своєю компактною, але потужною конструкцією. Попри менший розмір порівняно з конкурентами, такими як Llama-3 і Mistral Large, Phi-3 Mini відмінно справляється з обробкою контексту з 128 тис. лексем, конкуруючи навіть з більшими моделями, такими як GPT-4.

Помітною перевагою Phi-3 Mini є його сумісність зі смартфонами, продемонстрована успішним тестуванням на iPhone 14. Він працює плавно, генеруючи 14 токенів в секунду і вимагаючи лише 1,8 ГБ оперативної пам’яті, що робить його придатним для користувачів з особливими потребами і обмеженими ресурсами.

Хоча Phi-3 Mini не може задовольнити загальні вимоги, він виявляється ефективним для стартапів, які потребують чат-ботів, завдань з аналізу даних та пошуку інформації в режимі реального часу. Високі результати тестування обумовлені використанням набору даних від Microsoft, який фокусується на корисній інформації та ставить Phi-3 вище за конкурентів у завданнях на міркування.

Хоча Phi-3 не має відкритого вихідного коду, як його попередник Phi-2, він залишається загальнодоступним для використання. Microsoft планує розширити сімейство Phi-3 такими моделями, як Phi-3 Small і Phi-3 Medium, щоб задовольнити різні потреби користувачів.