Появилась нейросеть, генерирующая реалистичные видео за минуту: что умеет Sora от авторов ChatGPT

Для того, чтобы получить видео, достаточно лишь сделать подробный текстовый запрос.
Появилась нейросеть, генерирующая реалистичные видео за минуту: что умеет Sora от авторов ChatGPT
OpenAI

Компания OpenAI представила нейросеть, которая генерирует реалистичные видео по текстовому описанию. Разработка получила название Sora в честь японского слова «небо».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Генеративная модель создает ролики длиной до одной минуты. При этом пользователь может указать Sora, какую тематику и какой стиль они должны иметь. В видео могут присутствовать сложные сцены и несколько персонажей сразу. Их движения и фон будут детализированы — причем чем конкретнее подсказки пользователя, тем более реалистичным будет результат.

Нажми и смотри

OpenAI опубликовала несколько демонстрационных роликов, на которых видно, как именно искусственный интеллект превращает задуманное авторами в жизнь. Так, в одном из видео старый внедорожник несется по гористой местности, поднимая за собой клубы пыли — картинка выглядит довольно натурально.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
OpenAI
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Однако есть в работе Sora и огрехи. Например, на видео, где кот сидит рядом с хозяином, спящим в кровати заметно, что некоторые движения персонажа отклоняются от реальности. Тем не менее общая картина выглядит вполне убедительно.

Нажми и смотри

Сейчас доступ к Sora открыт для некоторых создателей видео-контента, которые могут протестировать модель на нарушение условий деятельности OpenAI. Речь идет об экстремальном насилии, сексуальном контенте, изображениях, разжигающих ненависть, использовании образов знаменитостей или чужой интеллектуальной собственности.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
OpenAI

В ходе обучения сети, как отмечает глава OpenAI Сэм Альтман, использовались общедоступные и лицензированные ролики. При этом он не уточнил, какое именно количество видео было задействовано в этом процессе.

Ранее мы рассказывали о конкуренте ChatGPT от компании Nvidia. Ее специалисты создали чат-бота, который обрабатывает пользовательские файлы, выуживая из них информацию по запросу. При этом бот автономен – для его работы не требуется подключение к интернету.