BTC$29880

ETH$3666

Шукати

Apple випускає моделі ШІ з відкритим вихідним кодом, призначені для роботи на мобільних пристроях

Apple вийшла на арену генеративного ШІ з OpenELM, новим сімейством великих мовних моделей з відкритим вихідним кодом, призначених для функціонування на одному пристрої, що усуває потребу в хмарних серверах. Цей крок слідує за такими технологічними гігантами, як Google, Samsung і Microsoft, і демонструє прихильність Apple до розвитку можливостей штучного інтелекту.

OpenELM складається з восьми моделей, у тому числі чотирьох попередньо навчених і чотирьох варіантів, що налаштовуються за допомогою інструкцій. Ці моделі охоплюють діапазон розмірів параметрів від 270 мільйонів до 3 мільярдів, пропонуючи різноманітні можливості для задач генерації тексту. У той час як попереднє навчання забезпечує зв’язність згенерованого тексту, налаштування інструкцій покращує реакцію моделей на конкретні запити користувачів, що є вирішальним аспектом у практичних застосуваннях.

Рішення Apple поширити ваги моделей OpenELM за ліцензією на зразки коду відображає її відданість сприянню відкритим дослідженням та впровадженню інновацій. Моделі, навчені на величезних наборах даних з таких платформ, як Reddit, Wikipedia та arXiv.org, демонструють перспективні показники продуктивності, зокрема, ефективності та точності.

Попри менший розмір порівняно з деякими високопродуктивними моделями, OpenELM демонструє пристойну продуктивність у різних тестах. Акцент на багаторівневому масштабуванні та ефективності обчислень підкреслює прихильність Apple до створення впливових рішень для галузі штучного інтелекту.