26.06.2024 13:34

Llama.ttf об’єднав велику мовну модель зі шрифтами

Концепція llama.ttf являє собою цікаву суміш типографіки та штучного інтелекту, в якій файл шрифту є одночасно великою мовною моделлю (LLM) та механізмом виведення для цієї моделі. Такий творчий підхід використовує механізм формування шрифтів HarfBuzz, який використовується в таких програмах, як Firefox і Chrome, і містить WebAssembly (Wasm) Shaper, що дозволяє виконувати довільний код для «формування» тексту. Теоретично, цей довільний код може включати повний механізм виведення LLM з набором навчених параметрів, що дозволяє моделі генерувати текст на основі певних символів, вбудованих у текст.

Інтеграція великої мовної моделі у файл шрифту, названий llama.ttf на честь моделі мови Llama є не просто теоретичною розробкою, а функціональною реальністю. Ця трансформація означає, що користувачі можуть використовувати шрифт для запуску мовної моделі та генерації тексту в будь-якому додатку, що підтримує Wasm і базується на HarfBuzz. Сюди входять різні текстові редактори, поштові клієнти та інші програми, і все це без необхідності для постачальників впроваджувати функції штучного інтелекту, такі як «Copilot», які багато компаній зараз намагаються інтегрувати. Примітно, що всі операції виконуються локально, що підвищує конфіденційність і безпеку даних.

Практичне використання llama.ttf не викликає труднощів у тих, хто має технічну підготовку. Завантаживши файл шрифту розміром 60 МБ, створений на основі моделі TinyStories з 15 мільйонами параметрів, користувачі можуть встановити його як будь-який звичайний шрифт. Ключ до розкриття його можливостей лежить у середовищі, яке використовує HarfBuzz з підтримкою Wasm. Практичний підхід полягає у створенні HarfBuzz з активним Wasm і компіляції мікропрограми wasm-micro-runtime з певними параметрами, а потім додаванні отриманих спільних бібліотек до змінної середовища LD_PRELOAD перед запуском програми на основі HarfBuzz, наприклад, gedit або GIMP. Таке налаштування не вимагає перекомпіляції самих програм.

Ця розробка розширює межі того, де і як можна вбудовувати та використовувати мовні моделі. Вбудовування LLM у файл шрифту — це нова ідея, яка поєднує лінгвістичний інтелект із повсюдним поширенням програмного забезпечення для обробки тексту. Це дає змогу користувачам створювати текст безпосередньо в улюблених програмах, не чекаючи на інтеграцію технологій штучного інтелекту від розробників програмного забезпечення.

Проєкт llama.ttf також спрощує технічні складнощі для користувачів. Вибравши шрифт LlamaSans у своєму додатку і використавши серію знаків оклику (“!!!») для активації режиму генерації, після чого вводиться текст і ще один знак оклику (»!») для завершення речення, можна легко взаємодіяти з моделлю. Цей метод підкреслює потенціал практичного створення тексту за допомогою ШІ в реальному часі у звичному програмному середовищі.

Отже, llama.ttf є прикладом творчого і функціонального перетину ШІ та технології шрифтів, представляючи універсальний інструмент, який демократизує доступ до передових мовних моделей. Такий підхід не лише підвищує корисність стандартного програмного забезпечення, а й дає змогу зазирнути в майбутнє, де ШІ та повсякденні інструменти поєднуються бездоганно, роблячи складні технології доступнішими та інтегрованими в наші повсякденні робочі процеси.