07.06.2024 14:43

Luna від Galileo переосмислює стандарти GenAI

Компанія Galileo, яка займається виробництвом і забезпеченням надійного впровадження додатків генеративного ШІ в масштабах всього підприємства, запустила Galileo Luna — набір моделей оцінювання (EFM), покликаних підвищити швидкість, економічність і точність оцінювання систем генеративного ШІ. Вікрам Чаттерджі, співзасновник і генеральний директор Galileo, підкреслив актуальність Luna, зазначивши, що наявні методи оцінки часто є повільними, дорогими та неточними.

Luna, новий набір моделей оцінювання Galileo, перевершує провідні методології оцінювання ШІ в порівняльному аналізі площі під кривою робочої характеристики приймача (AUROC), що є еталонним показником. Більш високі значення AUROC, що досягають 0,78, демонструють чудову точність Luna в оцінці систем штучного інтелекту, що генеруються на підприємстві, перевершуючи таких конкурентів, як GPT-3.5, Trulens Groundedness і RAGAS Faithfulness. Джерело

Розробка Luna зайняла майже рік інтенсивних досліджень і розробок. Пакет включає спеціально створені невеликі мовні моделі для конкретних завдань оцінювання, таких як виявлення галюцинацій, оцінка якості контексту, запобігання витоку даних та оперативне виявлення зловмисного програмного забезпечення. Ці моделі дозволяють проводити оцінку на 97% дешевше і в 11 разів швидше, ніж за допомогою GPT-3.5, забезпечуючи при цьому чудову точність.

Якщо порівнювати щомісячні витрати на оцінку 1 мільйона запитів, то Luna від Galileo значно поступається іншим методологіям, оскільки її вартість становить лише 175 доларів на місяць. Спеціально створені невеликі мовні моделі Luna уможливлюють наднизькі витрати, що робить її на 97% економічно ефективнішою за такі альтернативи.. Джерело

Особливістю Luna є її здатність працювати без використання звичайних баз даних. Замість цього вона використовує попередньо навчені моделі, точно налаштовані на різноманітних наборах даних, що усуває потребу в спеціальних тестових наборах і зменшує залежність від даних, згенерованих людиною. Такий підхід робить Luna особливо цінною в галузях, що вимагають високої надійності та швидкості, таких як охорона здоров’я, фінанси та телекомунікації.

Luna від Galileo забезпечує високу швидкість оцінки ШІ, затримка обробки одного запиту становить лише 0,232 секунди. Це значне поліпшення порівняно з іншими методологіями, такими як GPT-3.5 — 2,5 секунди, Galileo Chainpoll — 3,0 секунди, Trulens Groundedness — 3,4 секунди і RAGAS Faithfulness — 5,4 секунди. Спеціально створені невеликі мовні моделі Luna дозволяють проводити оцінку з наднизькою затримкою, що робить її в 11 разів швидшою за конкуруючі підходи. Джерело

Luna застосовується для моніторингу результатів роботи ШІ в реальному часі, виявлення галюцинацій та забезпечення якості взаємодії з чат-ботами. Її можна налаштувати за допомогою продукту Fine Tune від Galileo, щоб відповідати конкретним галузевим вимогам, досягаючи високої точності для критично важливих завдань у таких секторах, як фармацевтика та фінансові послуги.

Galileo прагне розширити можливості Luna шляхом підтримки більшої кількості завдань з оцінки, підвищення точності та подальшого зниження витрат і затримок. У міру розвитку ландшафту генеративного ШІ швидкі, економічно ефективні й точні оцінки Luna сприятимуть широкому впровадженню і розкриттю повного потенціалу технології генеративного ШІ.