
Співзасновник Instagram приєднався до Anthropic
Співзасновник Instagram Майк Крігер приєднався до Anthropic, стартапу в галузі штучного інтелекту, відомого своїм сімейством великих мовних моделей Claude 3.

Співзасновник Instagram приєднався до Anthropic
Співзасновник Instagram Майк Крігер приєднався до Anthropic, стартапу в галузі штучного інтелекту, відомого своїм сімейством великих мовних моделей Claude 3.

Gemini Nano від Google з’явився в десктопному клієнті Chrome
Інтеграція Gemini в десктопний клієнт Chrome від Google стала ще одним кроком у доступності ШІ як для розробників, так і для користувачів. З майбутнім оновленням Chrome розробники зможуть скористатися можливостями Gemini Nano.

Google змагається з Sora від OpenAI за допомогою нової моделі генерації відеороликів Veo
Нова модель генерації відео Veo від Google, представлена на щорічній конференції для розробників I/O, викликала справжній фурор у сфері візуалізації руху, конкуруючи з Sora від OpenAI за реалістичністю та якістю.

Google представляє Imagen 3
Google готується представити Imagen 3, оновлену модель перетворення тексту в зображення, яка обіцяє неперевершений рівень деталізації, покращене розуміння природної мови та розширені можливості рендерингу тексту.

Google анонсував швидку мультимодальну модель Gemini 1.5 Flash
Google розпочинає впровадження Gemini 1.5 Flash — компактної мультимодальної моделі, призначеної для вирішення окремих завдань, орієнтованих на високу швидкість і масштабування. Вона може похвалитися контекстним вікном на мільйон токенів і тепер доступна для публічного попереднього ознайомлення через Gemini API в Google AI Studio.

Google випустив Gemini 1.5 Pro
Gemini 1.5 Pro передбачає подальший розвиток можливостей штучного інтелекту Gemini, відомого своєю розмовною майстерністю та інтуїтивно зрозумілими особливостями. Завдяки розширеному контекстному вікну до 1 мільйона токенів, Gemini Advanced тепер готовий обробляти складні документи та довгі потоки електронної пошти.

Масштабування мультимодального ШІ за допомогою CuMo
Використовуючи CuMo, дослідники інтегрували розріджені блоки MoE в кодер технічного зору і модуль мови технічного зору мультимодальної LLM.

Новий GPT-4o від OpenAI вміє бути саркастичним, співати та навчати
GPT-4o (Omni) від OpenAI вривається в день, руйнуючи обмеження традиційних мовних моделей. Це не звичайний помічник зі штучним інтелектом ─ GPT-4o диригує симфонією почуттів, обробляючи інформацію за допомогою зору, звуку та розмови в реальному часі. Подивімося, як GPT-4o переписує сценарій взаємодії людини та комп'ютера.

Nvidia запускає квантові обчислювальні центри по всьому світу
Нещодавно компанія Nvidia зробила важливу заяву про свої наміри прискорити впровадження квантових обчислень у національних обчислювальних центрах по всьому світу за допомогою платформи з відкритим вихідним кодом Nvidia CUDA-Q.

Perplexity та SoundHound об’єднуються, щоб зробити голосового помічника Chat AI ще розумнішим
Perplexity, лідер у галузі систем знань на основі штучного інтелекту, оголосив про нове партнерство з SoundHound, компанією, що спеціалізується на голосовому ШІ. Ця співпраця має на меті значно посилити можливості голосового асистента Chat AI від SoundHound.

Invoke AI представляє нові інструменти для кращого контролю над генерацією зображень
Invoke AI, платформа для створення зображень на основі штучного інтелекту, випустила два нових інструменти, які дають користувачам більше можливостей для контролю над процесом генерації зображень.

Dell та Intel підтримали хмарну платформу RunPod на $20 млн
Стартап RunPod, що спеціалізується на інфраструктурі штучного інтелекту, залучив значне початкове фінансування у розмірі 20 мільйонів доларів США від Dell Technologies Capital та Intel Capital.