BTC$29880

ETH$3666

Шукати

Microsoft представила маленьку мовну модель Phi-2, яка перевершує великі мовні моделі

Microsoft Research оголосила про випуск Phi-2, малої мовної моделі (SLM), яка демонструє неабиякі можливості для свого розміру.

Phi-2 має лише 2,7 мільярда параметрів, що у 25 разів менше, ніж у великих мовних моделей, таких як GPT, Gemini та PaLM-2. Однак, попри свій невеликий розмір, Phi-2 демонструє високі показники в тестах на розуміння мови, міркування та математику.

Джерело: Microsoft.

Microsoft Research досягла цього успіху шляхом використання високоякісних навчальних даних і передових методів масштабування. Це дозволило створити модель, яка може виконувати конкретні завдання, такі як математика та обчислення, з такою ж ефективністю, як і великі мовні моделі.

Phi-2 має кілька потенційних переваг перед великими мовними моделями. По-перше, вона може запускатися на обладнанні низького рівня, навіть потенційно на смартфонах. Це відкриває шлях для нових додатків і варіантів використання. По-друге, Phi-2 є більш безпечною, оскільки вона має меншу кількість параметрів, які потенційно можуть бути використані для шкідливих цілей.

Оскільки ландшафт ШІ продовжує розвиватися, Phi-2 від Microsoft є свідченням того, що розмір не завжди є найважливішим фактором у мовних моделях ШІ. Іноді найбільша сила полягає в тому, щоб бути меншим і розумнішим.