Настільки важкий тест. Жодна система штучного інтелекту поки не може його пройти

«Творці нового тесту під назвою «Останній іспит людства» стверджують, що незабаром ми можемо втратити можливість створювати достатньо складні тести для моделей ШІ.», — пишуть на: www.nytimes.com

Кредит…Рун Фіскер

ЗМІНА

Коли штучний інтелект пройде цей тест, будьте уважніТворці нового тесту під назвою «Останній іспит людства» стверджують, що незабаром ми можемо втратити можливість створювати достатньо складні тести для моделей ШІ.

Кредит…Рун Фіскер

Якщо ви шукаєте нову причину хвилюватися щодо штучного інтелекту, спробуйте це: деякі з найрозумніших людей у світі намагаються створити тести, які системи ШІ не можуть пройти.

Протягом багатьох років системи штучного інтелекту вимірювалися, надаючи новим моделям різноманітні стандартизовані порівняльні тести. Багато з цих тестів складалися зі складних завдань рівня SAT у таких сферах, як математика, природничі науки та логіка. Порівняння балів моделей за час служило приблизним показником прогресу ШІ.

Але згодом системи штучного інтелекту виявилися надто хорошими в цих тестах, тому було створено нові, складніші тести — часто з типами запитань, з якими аспіранти можуть зіткнутися на іспитах.

Ці тести також не в хорошому стані. Нові моделі таких компаній, як OpenAI, Google і Anthropic, отримують високі бали в багатьох завданнях на рівні доктора філософії, що обмежує корисність цих тестів і викликає жахливе запитання: чи системи штучного інтелекту стають занадто розумними, щоб ми могли їх вимірювати?

Цього тижня дослідники з Центру безпеки штучного інтелекту та масштабування штучного інтелекту опублікували можливу відповідь на це запитання: нове оцінювання під назвою «Останній іспит людства», яке, за їхніми словами, є найважчим випробуванням, яке коли-небудь проводили для систем ШІ.

Humanity’s Last Exam – це дітище Дена Хендрікса, відомого дослідника безпеки ШІ та директора Центру безпеки ШІ. (Оригінальна назва тесту «Останній бій людства» була відхилена через надмірну драматичність.)

Name	Price	24H (%)
Bitcoin(BTC)	$103,347.00	-0.69%
Ethereum(ETH)	$3,257.42	-0.10%
XRP(XRP)	$3.09	-2.70%
Tether(USDT)	$1.00	0.05%
Solana(SOL)	$247.17	-6.14%
BNB(BNB)	$684.48	-1.93%
USDC(USDC)	$1.00	0.00%
Dogecoin(DOGE)	$0.346481	-3.48%
Cardano(ADA)	$0.97	-1.80%
TRON(TRX)	$0.249513	-2.04%
Toncoin(TON)	$5.08	-3.87%
Official Trump(TRUMP)	$34.93	-9.60%
Pepe(PEPE)	$0.000014	-5.62%
POL (ex-MATIC)(POL)	$0.433399	-2.82%
Notcoin(NOT)	$0.004954	-5.71%

Вхід

Реєстрація

Міністерство юстиції наказує припинити діяльність із захисту прав громадян

Поради експертів, як продовжувати тренуватися в холодну зимову погоду

nytimes

ПОВ'ЯЗАНІ НОВИНИ

ШІ може допомогти діагностувати деменцію за допомогою офтальмологічних тестів

Місія «Темний кисень» спрямована на інші світи

Технологічні лідери обіцяють інвестувати до 500 мільярдів доларів США в штучний інтелект

Залишити коментар Скасувати відповідь