«Два дослідження поставили ChatGPT, Gemini та інших на перевірку здоров’я. В одному вони дали майже половину відповідей неправильно.», — пишуть на: www.washingtonpost.com
Демократія вмирає в темряві
Два дослідження поставили ChatGPT, Gemini та інших на перевірку здоров’я. В одному вони дали майже половину відповідей неправильно.
Вчора о 5:00 ранку EDT
(Ілюстрація Washington Post; iStock)
Коли дослідник Ніколас Тіллер почав вводити питання про здоров’я в чат-ботів як тест, він очікував деяких недосконалостей — але не такого рівня провалу.
П’ять штучних інтелектів, 250 запитань і загальна кількість правильних відповідей трохи більше 50 відсотків.
