Будет понимать вас с полуслова: что умеет ИИ от Apple и когда он станет доступен каждому пользователю?
Компанию Apple в последние годы часто критикуют за то, что она якобы утратила свою главную суперспособность — первой выпускать по-настоящему прорывные продукты, не имеющие аналогов в индустрии и переворачивающие пользовательский опыт. С этим можно соглашаться или нет, но, возможно, дело не столько в том, что Apple сбавила обороты, сколько в том, что их невероятно нарастили другие участники рынка.
То же самое относится к сфере искусственного интеллекта. На фоне того, как весь технологический мир соревнуется во внедрении AI во все, что обладает микропроцессором и выходом в интернет, складывается впечатление, что Apple опоздала на ИИ-вечеринку. Но это не совсем так.
Публикация портала The Verge проливает свет на то, над чем работают подопечные Тима Кука. В материале утверждается, что Apple ведет переговоры с OpenAI и Google об использовании некоторых функций искусственного интеллекта, а также работает над собственной моделью под названием Ajax.
Большой интеллект в маленьком форм-факторе
AI-технологии станут одной из принципиальных особенностей новой iOS 18, которую представят в июне 2024 года. Генеративный ИИ будет задействован, в частности, в приложениях Apple Music, Pages, Keynote и Xcode. В Apple Music ИИ будет предлагать автоматически генерируемые плейлисты, а Pages и Keynote смогут создавать по запросу пользователя тексты и слайды.
Обновиться до новой оси можно будет в сентябре. Apple планирует, что все функции искусственного интеллекта будут работать на устройстве полностью автономно. Вызов состоит в том, что продвинутая языковая модель вроде ChatGPT и ей подобных требует больших мощностей — целых дата-центров и сотен процессоров, поэтому в массе своей это облачные решения. Apple же попытается обойтись локальными ресурсами смартфона.
Для этого разработано два решения:
- Система хранения данных AI на SSD-накопителе, а не в оперативной памяти устройства.
По мнению исследователей, при запуске с SSD ИИ-модели смогут работать быстрее и эффективнее.
- Алгоритм сжатия ИИ под названием EELBERT.
Утверждается, что с его помощью удалось сжать модель LLM Berta от Google в 15 раз — до 1,2 Мб — со снижением ее качества лишь на 4%.
Siri станет сообразительнее и умнее
Подвижки Apple в области ИИ, в числе прочего, должны улучшить работу голосового помощника Siri.
В Apple хотят сделать так, чтобы вызывать ассистента можно было без использования команды пробуждения Hey Siri! или просто Siri! То есть искусственный интеллект сам, без использования вводных фраз, догадается, что вы обращаетесь к нему, а не разговариваете с соседом по комнате. Исследователи признают, что добиться этого будет гораздо сложнее, чем научить виртуального ассистента распознавать конкретный голосовой триггер.
Также ведутся работы над тем, чтобы научить ИИ-модель лучше понимать редкие слова, которые часто ставят в тупик электронных ассистентов и заставляют их задавать пользователю уточняющие вопросы.
В обоих случаях инженерам необходимо научить ИИ обрабатывать больше информации за еще более короткий промежуток времени. Работая над этим, в Apple уже обнаружили, что функция пробуждения ассистента работает надежнее и качественнее, если не отбрасывать посторонние звуки, а позволить модели самой отделять неважное от важного.
Также Apple разрабатывает систему STEER (Semantic Turn Extension-Expansion Recognition), которая должна улучшить взаимопонимание между голосовым ассистентом и пользователем. В частности, обучить ИИ понимать, когда вы задаете уточняющий (следующий) вопрос, а когда — новый, и правильно распознавать, что вы имеете в виду, когда запрос звучит двусмысленно.
Наконец, LLM может сделать голосовых ассистентов менее многословными и давать более емкие и четкие ответы.
Что сможет ИИ от Apple
Apple изучает возможность использовать ИИ в качестве персонального ассистента для контроля за здоровьем, для художественной обработки изображений и для интеграции в фирменные стриминговые сервисы.
Например, смартфон или часы смогут анализировать множество собираемых разнообразными приложениями и девайсами биометрических показателей своего владельца и выдавать максимально понятный и структурированный отчет. Это может быть полезно, например, атлетам для корректировки тренировочного процесса.
Инструмент MGIE позволит творчески обрабатывать изображение на основе запроса пользователя вместо того, чтобы по старинке накладывать фильтры и ретушировать вручную. Вы буквально сможете попросить «сделай мне лицо попроще», и AI отредактирует ваш портрет.
А если вы любите петь или делать ремиксы, то отдельная AI-утилита в Apple Music уберет вокал из нужного вам трека, чтобы вы могли исполнить песню самостоятельно или спродюсировать свою версию композиции.
Итак, если верить The Verge и другим источникам, новая Siri (или то, что придет ей на смену, ведь вам уже не надо будет обращаться к ней по имени) сможет:
- следить за вашим здоровьем;
- обрабатывать изображения, как вы попросите;
- делать минусовки из ваших любимых треков в Apple Music;
- понимать вас с полуслова (или нескольких) и улавливать, когда вам нужна ее помощь;
- давать более понятные и емкие ответы;
- давать советы (возможно даже непрошеные);
- и все это не потребует постоянного подключения к облаку, то есть в теории ИИ от Apple сможет работать даже оффлайн.
Что из этого мы реально сможем опробовать в этом году или позже, узнаем уже в июне на следующей большой презентации Apple.