До меня дошло множество слухов о предполагаемых планах Apple по созданию сверхмощного цифрового помощника Siri на Всемирной конференции разработчиков (WWDC) 2024 года. Сегодня благодаря ребятам из Apple Insider мы получили самую полную утечку информации на сегодняшний день. Утечка, получена от “людей, знакомых с инициативой Apple в области искусственного интеллекта”. Она с одержит все, что Siri сможет делать в приложениях для iPhone от производителя.
Статью стоит дочитать, особенно если вы пользователь iPhone. Я расскажу в общих чертах о целях Apple в отношении “новой” Siri. А так же поделюсь некоторыми основными моментами, которые, по моему мнению, больше всего повлияют на повседневную жизнь пользователей iPhone.
Чего Apple хочет от новой Siri?
Общая цель Siri состоит в том, чтобы сделать ее более мощной и лучше понимать голосовые команды, передаваемые на естественном языке. Согласно утечке, Apple якобы обучала Siri этому, заставляя технических специалистов Apple передавать команды, которые намеренно являются тупыми. Например, вместо того, чтобы просить что-то вроде “Привет, Siri, покажи мне фотографии моей кошки”, он тестирует более расплывчатые команды, такие как “Я хочу завести блог” или “Я сейчас испытываю ностальгию”. Это не конкретные команды, предписывающие Siri выполнять одну конкретную вещь. Siri нужно будет сначала интерпретировать, а затем решить, как наилучшим образом предоставить то, что, по ее мнению, может захотеть / понадобиться пользователю.
Преимущество этого очевидно. Оно заключается в том, что Siri становится лучше для пользователей, которые не знают (или не хотят использовать) правильный синтаксис, необходимый для выполнения команды. Например, пользователь, говорящий: “Привет, Siri, я хочу кофе”, может включить, а может и не включить умную кофеварку, в то время как “Привет, Siri, включи кофеварку”, скорее всего, включит. Первое является естественным утверждением, в то время как второе представляет собой прямую команду. Apple хочет, чтобы этот встроенный синтаксис был сокращен, что значительно упростило использование Siri.
Однако в утечке Apple Insider не упоминается, как это работает. Например, поддерживаются ли эти функции Siri ”Ajax», кодовое название внутренней модели большого языка Apple (LLM)? Или они основаны на ChatGPT, поскольку Apple якобы сотрудничает с OpenAI для некоторых своих систем на основе искусственного интеллекта? Возможно, здесь есть и то, и другое, но я пока не уверен.
Новые функции Siri: список основных
Как уже упоминалось, полная утечка является исчерпывающей. В ней рассказывается о не менее чем 18 приложениях и о том, как Siri сможет работать с каждым из них. Вот несколько, которые, на мой взгляд, действительно интересны:
- Камера: Siri сможет управлять камерой с помощью голосовых команд. Вы сможете включать или выключать запись видео, открывать камеру в определенном режиме (фото, портрет, видео и т.д.). А затем запускать таймер спуска затвора и переключаться на переднюю или заднюю камеру. Теоретически это может позволить вам настроить свой iPhone на групповое фото, отойти в сторону, а затем использовать голосовые команды для удаленного захвата фотографии.
- Почта: Почтовое приложение проходит полную модернизацию. Очевидно, оно сможет автоматически классифицировать электронную почту с помощью машинного обучения, с которым пользователи Gmail, вероятно, уже знакомы. Кроме того, Siri также сможет выполнять подробные функции только с помощью голосовых команд. Сюда входят такие вещи, как составление электронного письма, его отправка, планирование, пометка электронного письма как нежелательного и установка напоминания о прочтении электронного письма позже. Он также сможет суммировать электронные письма и создавать “умные ответы”, функция, аналогичная функции Smart Reply на Android.
- Фотографии: Apple, вероятно, представит множество функций редактирования фотографий, основанных на генеративном искусственном интеллекте. Пользователи Pixel уже могут выполнять подобное с помощью Magic Editor и Google Photos. Например перемещение/удаление объекта с фотографии и заполнение пробелов с помощью генеративного искусственного интеллекта. Поиск конкретных фотографий с конкретными людьми / животными и применение генеративных фильтров искусственного интеллекта.
- Safari: веб-браузер Apple будет использовать Siri для просмотра сводок веб-страниц. Подобное Google уже внедрил в Android через Gemini. Safari также сможет создавать новые группы вкладок или открывать новую приватную вкладку с помощью голосовых команд.
- Голосовые заметки: Вы сможете пользоваться Siri без помощи рук, используя голосовые заметки. Например, вы можете попросить Siri создать новую запись голоса, а затем начать говорить. Затем вы можете остановить запись, сохранить ее под определенным именем и даже переместить в определенную папку — и все это, не прикасаясь пальцем к своему iPhone.
Когда ждать?
По словам постоянного представителя Apple Марка Гурмана, по крайней мере, некоторые функции Siri на самом деле не будут представлены на WWDC. Apple почти наверняка анонсирует некоторые из них, но не все будут доступны в 2024 году. Гурман утверждает, что только в 2025 году большинство этих функций будут обновлены с помощью программного обеспечения.
Конечно, это не означает, что Apple не выпустит хотя бы несколько из них на WWDC. Однако, вероятно, лучше не ожидать, что iOS 18 будет поставляться со всеми функциями, описанными в этой утечке.