23 Січня, 2025
Настільки важкий тест. Жодна система штучного інтелекту поки не може його пройти thumbnail
Технології

Настільки важкий тест. Жодна система штучного інтелекту поки не може його пройти

«Творці нового тесту під назвою «Останній іспит людства» стверджують, що незабаром ми можемо втратити можливість створювати достатньо складні тести для моделей ШІ.», — пишуть на: www.nytimes.com

Кредит…Рун Фіскер

ЗМІНА

Коли штучний інтелект пройде цей тест, будьте уважніТворці нового тесту під назвою «Останній іспит людства» стверджують, що незабаром ми можемо втратити можливість створювати достатньо складні тести для моделей ШІ.

Кредит…Рун Фіскер

Якщо ви шукаєте нову причину хвилюватися щодо штучного інтелекту, спробуйте це: деякі з найрозумніших людей у ​​світі намагаються створити тести, які системи ШІ не можуть пройти.

Протягом багатьох років системи штучного інтелекту вимірювалися, надаючи новим моделям різноманітні стандартизовані порівняльні тести. Багато з цих тестів складалися зі складних завдань рівня SAT у таких сферах, як математика, природничі науки та логіка. Порівняння балів моделей за час служило приблизним показником прогресу ШІ.

Але згодом системи штучного інтелекту виявилися надто хорошими в цих тестах, тому було створено нові, складніші тести — часто з типами запитань, з якими аспіранти можуть зіткнутися на іспитах.

Ці тести також не в хорошому стані. Нові моделі таких компаній, як OpenAI, Google і Anthropic, отримують високі бали в багатьох завданнях на рівні доктора філософії, що обмежує корисність цих тестів і викликає жахливе запитання: чи системи штучного інтелекту стають занадто розумними, щоб ми могли їх вимірювати?

Цього тижня дослідники з Центру безпеки штучного інтелекту та масштабування штучного інтелекту опублікували можливу відповідь на це запитання: нове оцінювання під назвою «Останній іспит людства», яке, за їхніми словами, є найважчим випробуванням, яке коли-небудь проводили для систем ШІ.

Humanity’s Last Exam – це дітище Дена Хендрікса, відомого дослідника безпеки ШІ та директора Центру безпеки ШІ. (Оригінальна назва тесту «Останній бій людства» була відхилена через надмірну драматичність.)

Дякуємо за терпіння, поки ми перевіряємо доступ. Якщо ви перебуваєте в режимі читання, будь ласка, вийдіть і увійдіть у свій обліковий запис Times або підпишіться на всю The Times.

ПОВ'ЯЗАНІ НОВИНИ

ШІ може допомогти діагностувати деменцію за допомогою офтальмологічних тестів

bbc

Місія «Темний кисень» спрямована на інші світи

bbc

Технологічні лідери обіцяють інвестувати до 500 мільярдів доларів США в штучний інтелект

wsj

Залишити коментар

Цей веб-сайт використовує файли cookie, щоб покращити ваш досвід. Ми припустимо, що ви з цим згодні, але ви можете відмовитися, якщо хочете. Прийняти Читати більше