«Самая умная» нейросеть: кто победил в битве искусственных интеллектов?

Какая из нейросетей сможет лучше остальных проявить себя в разных задачах? Таким вопросом озадачился один любопытный пользователь сети. Для сравнения он использовал ChatGPT, Bard, Llama 2, а также Claude 2 и протестировал их возможности в пяти ключевых направлениях.

Freepik

Критическое мышление

Нейросети спросили, где находится бриллиант, если его положили в чашку, которая лежит на кровати вверх дном, а затем отнесли ее в холодильник. Догадаться, что драгоценность осталась на кровати, смогла только Claude 2.

Простая математика

Не справился с задачей только один из чат-ботов — Llama 2. Он не смог решить задачу из старшей школы и вычислить массу картошки после того, как ее высушат.

Программирование

В кодинге себя хорошо показали ChatGPT и Bard. Claude 2 и Llama 2 не сумели написать программу на Python.

Решение загадок

Головоломки оказались под силу всем, кроме Llama 2. Нейросеть озадачил простейший вопрос на логику: «У отца Дэвида есть сын. Как его зовут?»

Креативное письмо

Вырвались вперед Bard и Llama 2. Остальные не справились с сочинением стихотворения, каждая строчка которого заканчивалась бы на букву «е».

Итоги

В результате первое место между собой разделили Bard, ChatGPT и Claude 2. Им удалось заработать по 22 балла из 24. Проиграл чат-бот Llama 2 — у него 19 из 24.

Freepik

Между тем нейросеть дописала серию фэнтези-романов «Песнь льда и пламени» за Джорджа Мартина и cпела песню МакSим «Знаешь ли ты» голосом Егора Летова.