«Самая умная» нейросеть: кто победил в битве искусственных интеллектов?
Какая из нейросетей сможет лучше остальных проявить себя в разных задачах? Таким вопросом озадачился один любопытный пользователь сети. Для сравнения он использовал ChatGPT, Bard, Llama 2, а также Claude 2 и протестировал их возможности в пяти ключевых направлениях.
Критическое мышление
Нейросети спросили, где находится бриллиант, если его положили в чашку, которая лежит на кровати вверх дном, а затем отнесли ее в холодильник. Догадаться, что драгоценность осталась на кровати, смогла только Claude 2.
Простая математика
Не справился с задачей только один из чат-ботов — Llama 2. Он не смог решить задачу из старшей школы и вычислить массу картошки после того, как ее высушат.
Программирование
В кодинге себя хорошо показали ChatGPT и Bard. Claude 2 и Llama 2 не сумели написать программу на Python.
Решение загадок
Головоломки оказались под силу всем, кроме Llama 2. Нейросеть озадачил простейший вопрос на логику: «У отца Дэвида есть сын. Как его зовут?»
Креативное письмо
Вырвались вперед Bard и Llama 2. Остальные не справились с сочинением стихотворения, каждая строчка которого заканчивалась бы на букву «е».
Итоги
В результате первое место между собой разделили Bard, ChatGPT и Claude 2. Им удалось заработать по 22 балла из 24. Проиграл чат-бот Llama 2 — у него 19 из 24.