15 Мар 2023, 14:16

Привет, ChatGPT. Гудбай, Siri, Alexa и Google Assistant?

Виртуальным помощникам понадобилось больше десяти лет, чтобы стать незаменимыми. Но им мешали неуклюжий дизайн и просчеты, что оставляло простор для развития чат-ботов. The New York Times разбирается, какое будущее ждет Siri, Alexa и Google Assistant.

В дождливый вторник в Сан-Франциско руководители Apple вышли на сцену в переполненной аудитории, чтобы представить iPhone пятого поколения. Телефон, выглядевший так же, как и предыдущая версия, имел новую функцию, о которой вскоре гудела аудитория — Siri, виртуальный помощник.

Скотт Форстолл, тогдашний руководитель отдела программного обеспечения Apple, нажал кнопку iPhone, чтобы вызвать Siri, и задал ей вопрос. По его просьбе Siri проверила время в Париже («8:16 вечера», — ответила Сири), определила слово «митоз» («разделение клетки, во время которого ядро делится на ядра, содержащие одинаковое количество хромосом») и составила список из 14 греческих ресторанов с высоким рейтингом, пять из них в Пало-Альто, Калифорния.

«Я занимался ИИ в течение длительного времени, и это все еще меня поражает», — сказал Форстолл.

Это было 12 лет назад. С тех пор люди были далеко не в восторге от Siri и конкурирующих помощников, работающих на основе искусственного интеллекта, таких как Alexa от Amazon и Google Assistant. Технология в большинстве своем осталась на месте, а разговорные помощники стали предметом шуток, в частности в скетче «Saturday Night Live» 2018 года, где изображена умная колонка для людей в возрасте.

Мир технологий сейчас полон нового типа виртуальных помощников: чат-ботов. Эти боты на основе искусственного интеллекта, такие как ChatGPT и новый ChatGPT Plus от компании OpenAI из Сан-Франциско могут быстро импровизировать ответы на вопросы, введенные в окне чата. Люди используют ChatGPT для решения сложных задач, таких как кодирование программного обеспечения, составление бизнес-предложений и написание художественной литературы.

И ChatGPT, использующий ИИ, быстро усовершенствуется. Несколько месяцев назад он не мог написать должное хайку — теперь он может делать это с удовольствием. Во вторник OpenAI представила свой ИИ нового поколения — версию GPT-4.

Ажиотаж вокруг чат-ботов иллюстрирует, как Siri, Alexa и другие голосовые помощники, которые когда-то вызывали подобный энтузиазм, упустили свою лидерскую позицию в гонке ИИ.

Amazon и Google неправильно рассчитали, как будут использоваться голосовые помощники, что заставило их инвестировать в области с технологией, которая редко окупалась.

В течение последнего десятилетия продукты наталкивались на препятствия. По словам Джона Берки, бывшего инженера Apple, работавшего над помощником, Siri столкнулась с технологическими препятствиями, включая угловатый код, для обновления которого понадобились недели с базовыми функциями. По словам бывших сотрудников, Amazon и Google неправильно рассчитали, как будут использоваться голосовые помощники, что заставило их инвестировать в области с технологией, которая редко окупалась. Когда эти эксперименты провалились, энтузиазм по технологии утих в компаниях, говорят они.

Голосовые помощники «тупые, как камень», — сказавл Сатья Наделла, исполнительный директор Microsoft, в интервью The Financial Times в этом месяце, заявив, что новый ИИ будет лидировать. Microsoft тесно сотрудничает с OpenAI, инвестировав 13 миллиардов долларов в стартап и включив его технологию в поисковую систему Bing, а также другие продукты.

Apple отказалась комментировать по Siri. Google заявил, что стремится создать отличного виртуального помощника, который поможет людям пользоваться телефонами, домами и автомобилями; компания отдельно тестирует чат-бота под названием Bard. Компания Amazon заявила, что за последний год вовлеченность клиентов по всему миру с Alexa выросла на 30 процентов и что она оптимистично смотрит на свою миссию создать искусственный интеллект мирового уровня.

Alexa, голосовой помощник, был встроен в устройства Amazon Echo
Помощники и чат-боты основаны на разных типах ИИ.

Помощники и чат-боты основаны на разных типах ИИ. Чат-боты работают на основе так называемых крупных языковых моделей, являющихся системами, обученными распознавать и генерировать текст на основе огромных массивов данных, собранных из интернета. Затем они могут предложить слова для завершения предложения.

Напротив, Siri, Alexa и Google Assistant — это, в сущности, то, что известно как система командования и управления. Они могут понять ограниченный список вопросов и запросов типа «Какая погода в Нью-Йорке?» или «Включите свет в спальне». Если пользователь просит виртуального помощника сделать что-нибудь, чего нет в его коде, бот просто говорит, что не может помочь.

Siri также имела громоздкий дизайн, из-за чего добавление новых функций занимало много времени, сказал Берки, которому поручили улучшить Siri в 2014 году. База данных Siri содержит гигантский список слов, включая имена музыкальных исполнителей и местоположения, такие как рестораны, почти на двух десятках языков.

По его словам, Siri стала «одним большим снежным комом». Если кто-то хотел добавить слово в ее базу данных, «оно собиралось в одну большую кучу».

Так что, казалось бы, простые обновления, например, добавление новых фраз в набор данных, требуют перестройки всей базы данных, которая может занять до шести недель, сказал Берки. Добавление более сложных функций, таких как новые инструменты поиска может занять почти год. По его словам это означало, что Siri не может стать таким творческим помощником, как ChatGPT.

Бывшие менеджеры Amazon и Google сообщили, что Alexa и Google Assistant полагались на технологию, похожую на Siri, но компаниям было трудно получить значительный доход с помощью этих помощников (вместо этого Apple успешно использовала Siri, чтобы привлечь покупателей к своим iPhone).

Когда Amazon выпустил Echo, умный динамик на основе Alexa, в 2014 году, компания надеялась, что этот продукт поможет ей увеличить продажи в ее онлайн-магазине, позволяя потребителям разговаривать с Alexa, чтобы размещать заказы, сказал бывший руководитель Amazon, связанный с Alexa. Но хотя людям было весело играть со способностью Alexa отвечать на подсказки погоды и устанавливать будильники, мало кто просил Alexa заказывать вещи, добавил он.

По словам бывшего руководителя, Amazon, возможно, чрезмерно инвестировал в создание новых типов аппаратного обеспечения, таких как будильники и микроволновые печи, которые сейчас сняты с производства, работали с Alexa и продавались по себестоимости или ниже.

Компания также не инвестировала достаточно средств в создание экосистемы, с помощью которой люди могли бы легко расширить возможности Alexa, как Apple сделала со своим App Store, что помогло поднять интерес к iPhone. Несмотря на то, что Amazon предложила магазин «навыков», чтобы Alexa могла контролировать посторонние аксессуары, например выключатели света, людям было трудно найти и настроить навыки для динамиков — в отличие от легкой загрузки мобильных приложений из App Store.

«У нас никогда не было «App Store момента» у помощников», — сказала Каролина Миланези, аналитик потребительских технологий исследовательской фирмы Creative Strategies, которая была консультантом Amazon.

В конце прошлого года подразделение Amazon, работающее над Alexa, стало основной мишенью для увольнений 18 000 сотрудников компании, и несколько топ-менеджеров Alexa покинули компанию.

Кинли Пирсолл, пресс-секретарь Amazon, сказала, что Alexa — это гораздо больше, чем голосовой помощник, и «мы как никогда оптимистично смотрим на эту миссию».

Google Assistant был включен в домашние устройства компании, такие как умная колонка Google Home Mini

По словам бывшего менеджера, работавшего над Google Assistant, ошибки Amazon из Alexa могли сбить Google с пути. Инженеры Google годами экспериментировали с помощником, чтобы имитировать то, что могла делать Alexa, включая разработку умных динамиков и экранов планшетов с голосовым управлением для управления домашними аксессуарами, такими как термостаты и выключатели света. Позже компания интегрировала рекламу в эти продукты для дома, что не стало основным источником дохода.

Google понял, что большинство людей использовали голосового помощника только для ограниченного количества простых задач, таких как запуск таймеров и воспроизведение музыки.

Впоследствии Google понял, что большинство людей использовало голосового помощника только для ограниченного количества простых задач, таких как запуск таймеров и воспроизведение музыки, сказал бывший менеджер. В 2020 году, когда Прабхакар Рагхаван, исполнительный директор Google, возглавил Google Assistant, его группа переориентировала виртуального компаньона как характерную особенность смартфонов Android.

В январе, когда материнская компания Google уволила 12 000 сотрудников, команда, работающая над операционными системами для домашних устройств, потеряла 16 процентов своих инженеров.

Многие крупные технологические компании сейчас спешат предложить свои ответы на ChatGPT. В штаб-квартире Apple в прошлом месяце компания провела ежегодную конференцию по ИИ, внутреннее мероприятие для сотрудников, чтобы узнать его большую языковую модель и другие инструменты. Многие инженеры, включая членов команды Siri, еженедельно тестировали концепции создания языка, говорят люди.

Многие крупные технологические компании сейчас спешат предложить свои ответы на ChatGPT.

Во вторник Google также заявил, что в скором времени выпустит генеративные инструменты ИИ, которые помогут компаниям, правительствам и разработчикам программного обеспечения создавать программы со встроенными чат-ботами и внедрять базовую технологию в свои системы.

В будущем технологии чат-ботов и голосовых помощников будут сближаться, считают эксперты по ИИ. Это означает, что люди смогут управлять чат-ботами с помощью языка, а те, кто пользуется продуктами Apple, Amazon и Google, смогут просить виртуальных помощников помочь им в работе, а не только в таких задачах, как проверка погоды.

В будущем технологии чат-ботов и голосовых помощников будут сближаться.

«Эти продукты никогда не работали в прошлом, потому что у нас никогда не было возможностей диалога на уровне человека», — сказал Аравинд Сринивас, основатель Perplexity, стартапа, который предлагает поисковую систему на основе чат-бота. «Теперь мы имеем».

Кавер: Patrick Edell

Расскажите друзьям про новость

Новое видео