20.09.2024 17:51

Останній іспит для людства

Ініціатива «Останній іспит людства», започаткована CAIS та Scale AI покликана оцінити, наскільки ми наблизилися до створення систем штучного інтелекту, здатних працювати на рівні спеціалістів. Ініціатива має на меті зібрати найскладніші запитання від експертів з різних галузей, щоб створити новий публічний стандарт тестування ШІ, оскільки поточні тести стали занадто простими для просунутих моделей штучного інтелекту, зокрема, для нової моделі від OpenAI.

Взяти участь у проекті можна до 1 листопада 2024 року, а його учасники матимуть змогу отримати значні винагороди. Успішні заявки можуть призвести до співавторства у фінальному документі з призами з призового фонду в $500 000. Автори 50 найкращих запитань отримають по $5 000, а наступні 500 найкращих запитань будуть винагороджені по $500. Мета полягає в тому, щоб перевірити здатність передових систем штучного інтелекту вирішувати складні завдання високого рівня, які вимагають людського досвіду.

Штучний інтелект зробив значний стрибок, продемонструвавши винятково високі результати в наявних тестах. Однак він все ще не може відповідати на складні дослідницькі або інтелектуальні питання. «Останній іспит людства» сподівається вирішити цей недолік, запропонувавши новий стандарт, який розширює межі досліджень у галузі ШІ. Оскільки ми наближаємося до експертного рівня штучного інтелекту, розуміння його можливостей та обмежень стає все більш важливим.

Експертам пропонується надсилати складні, оригінальні та об’єктивні запитання. У рекомендаціях підкреслюється, що питання не повинні бути такими, на які легко відповісти студентам або які можна вирішити за допомогою простого пошуку в Інтернеті. Конфіденційність також є ключовим фактором, оскільки деякі питання будуть засекречені, щоб запобігти запам’ятовуванню відповідей штучним інтелектом, а найкращі роботи будуть винагороджені як за якість, так і за новизну.

Ця ініціатива не тільки дає можливість експертам зробити свій внесок у дослідження ШІ, але й підкреслює постійну проблему відстеження стрімкого розвитку ШІ. Те, як системи штучного інтелекту покажуть себе на «Останньому іспиті людства», може сформувати наше розуміння їхнього теперішнього та майбутнього потенціалу.