Віртуальним помічникам знадобилося більше десяти років, щоб стати незамінними. Але їм заважали незграбний дизайн і прорахунки, що залишало простір для розвитку чат-ботів. The new York Times розбирається, яке майбутнє чекає на Siri, Alexa та Google Assistant.
У дощовий вівторок у Сан-Франциско керівники Apple вийшли на сцену в переповненій аудиторії, щоб представити iPhone п’ятого покоління. Телефон, який виглядав так само, як і попередня версія, мав нову функцію, про яку незабаром гуділа аудиторія, — Siri, віртуальний помічник.
Скотт Форстолл, тодішній керівник відділу програмного забезпечення Apple, натиснув кнопку iPhone, щоб викликати Siri, і задав їй запитання. На його прохання Siri перевірила час у Парижі («8:16 вечора», — відповіла Сірі), визначила слово «мітоз» («поділ клітини, під час якого ядро ділиться на ядра, що містять однакову кількість хромосом») і склала список із 14 грецьких ресторанів із високим рейтингом, п’ять із них у Пало-Альто, Каліфорнія.
«Я займався ШІ протягом тривалого часу, і це все ще мене вражає», — сказав пан Форстолл.
Це було 12 років тому. Відтоді люди були далеко не в захваті від Siri та конкуруючих помічників, які працюють на основі штучного інтелекту, як-от Alexa від Amazon і Google Assistant. Технологія здебільшого залишилася на місці, а розмовні помічники стали предметом жартів, зокрема в скетчі «Saturday Night Live» 2018 року, де зображено розумну колонку для людей у віці.
Світ технологій зараз сповнений нового типу віртуальних помічників: чат-ботів. Ці боти на основі штучного інтелекту, такі як ChatGPT і новий ChatGPT Plus від компанії OpenAI з Сан-Франциско, можуть швидко імпровізувати відповіді на запитання, введені у вікні чату. Люди використовують ChatGPT для вирішення складних завдань, таких як кодування програмного забезпечення, складання бізнес-пропозицій і написання художньої літератури.
І ChatGPT, який використовує ШІ, швидко вдосконалюється. Кілька місяців тому він не міг написати належне хайку — тепер він може робити це із задоволенням. У вівторок OpenAI представила свій ШІ нового покоління — версію GPT-4.
Ажіотаж навколо чат-ботів ілюструє, як Siri, Alexa та інші голосові помічники, які колись викликали подібний ентузіазм, змарнували свою лідерську позицію в гонці ШІ.
Amazon і Google неправильно розрахували, як використовуватимуться голосові помічники, що змусило їх інвестувати в області з технологією, яка рідко окупалася.
Протягом останнього десятиліття продукти натрапляли на перешкоди. За словами Джона Беркі, колишнього інженера Apple, який працював над помічником, Siri зіткнулася з технологічними перешкодами, включно з незграбним кодом, для оновлення якого знадобилися тижні з базовими функціями. За словами колишніх співробітників, Amazon і Google неправильно розрахували, як використовуватимуться голосові помічники, що змусило їх інвестувати в області з технологією, яка рідко окупалася. Коли ці експерименти провалилися, ентузіазм щодо технології вщух у компаніях, кажуть вони.
Голосові помічники «тупі, як камінь», — сказав Сатья Наделла, виконавчий директор Microsoft, в інтерв’ю The Financial Times цього місяця, заявивши, що новий ШІ буде лідирувати. Microsoft тісно співпрацює з OpenAI, інвестувавши 13 мільярдів доларів у стартап і включивши його технологію в пошукову систему Bing, а також інші продукти.
Apple відмовилася коментувати щодо Siri. Google заявив, що прагне створити чудового віртуального помічника, який допоможе людям користуватися телефонами, будинками та автомобілями; компанія окремо тестує чат-бота під назвою Bard. Компанія Amazon заявила, що за останній рік залученість клієнтів у всьому світі з Alexa зросла на 30 відсотків і що вона оптимістично дивиться на свою місію створити штучний інтелект світового рівня.
Помічники та чат-боти засновані на різних типах ШІ.
Помічники та чат-боти засновані на різних типах ШІ. Чат-боти працюють на основі так званих великих мовних моделей, які є системами, навченими розпізнавати та генерувати текст на основі величезних масивів даних, зібраних з інтернету. Потім вони можуть запропонувати слова для завершення речення.
Навпаки, Siri, Alexa та Google Assistant — це, по суті, те, що відомо як система командування та управління. Вони можуть зрозуміти обмежений список запитань і запитів на зразок «Яка погода в Нью-Йорку?» або «Увімкніть світло в спальні». Якщо користувач просить віртуального помічника зробити щось, чого немає в його коді, бот просто каже, що не може допомогти.
Siri також мала громіздкий дизайн, через що додавання нових функцій займало багато часу, сказав пан Беркі, якому доручили покращити Siri у 2014 році. База даних Siri містить гігантський список слів, включаючи імена музичних виконавців і місця розташування, такі як ресторани, майже двома десятками мов.
За його словами, Siri стала «одним великим сніжним комом». Якщо хтось хотів додати слово до її бази даних, «воно збиралося в одну велику купу».
Тож, здавалося б, прості оновлення, як-от додавання нових фраз до набору даних, вимагатимуть перебудови всієї бази даних, що може зайняти до шести тижнів, сказав пан Беркі. Додавання більш складних функцій, таких як нові інструменти пошуку, може зайняти майже рік. За його словами, це означало, що Siri не може стати таким творчим помічником, як ChatGPT.
Колишні менеджери Amazon і Google повідомили, що Alexa і Google Assistant покладалися на технологію, схожу на Siri, але компаніям було важко отримати значний дохід за допомогою цих помічників (натомість Apple успішно використовувала Siri, щоб залучити покупців до своїх iPhone).
Коли Amazon випустив Echo, розумний динамік на основі Alexa, у 2014 році, компанія сподівалася, що цей продукт допоможе їй збільшити продажі в її онлайн-магазині, дозволяючи споживачам розмовляти з Alexa, щоб розміщувати замовлення, сказав колишній керівник Amazon, пов’язаний з Alexa. Але хоча людям було весело гратися зі здатністю Alexa відповідати на підказки погоди та встановлювати будильники, мало хто просив Alexa замовляти речі, додав він.
За словами колишнього керівника, Amazon, можливо, надмірно інвестував у створення нових типів апаратного забезпечення, як-от будильники та мікрохвильові печі, які зараз зняті з виробництва, які працювали з Alexa і продавалися за собівартістю або нижче.
Компанія також не інвестувала достатньо коштів у створення екосистеми, за допомогою якої люди могли б легко розширити можливості Alexa, як Apple зробила зі своїм App Store, що допомогло підняти інтерес до iPhone. Незважаючи на те, що Amazon запропонувала магазин «навичок», щоб Alexa могла контролювати сторонні аксесуари, як-от вимикачі світла, людям було важко знайти та налаштувати навички для динаміків — на відміну від легкого завантаження мобільних додатків із App Store.
«У нас ніколи не було ‘’App Store моменту’’ в помічників», — сказала Кароліна Міланезі, аналітик споживчих технологій дослідницької фірми Creative Strategies, яка була консультантом Amazon.
Наприкінці минулого року підрозділ Amazon, який працює над Alexa, став основною мішенню для звільнень 18 000 співробітників компанії, і кілька топ-менеджерів Alexa покинули компанію.
Кінлі Пірсолл, прес-секретар Amazon, сказала, що Alexa — це набагато більше, ніж голосовий помічник, і «ми як ніколи оптимістично дивимося на цю місію».
За словами колишнього менеджера, який працював над Google Assistant, помилки Amazon з Alexa могли збити Google зі шляху. Інженери Google роками експериментували з помічником, щоб імітувати те, що могла робити Alexa, включаючи розробку розумних динаміків і екранів планшетів з голосовим керуванням для керування домашніми аксесуарами, такими як термостати та вимикачі світла. Пізніше компанія інтегрувала рекламу в ці продукти для дому, що не стало основним джерелом доходу.
Google зрозумів, що більшість людей використовували голосового помічника лише для обмеженої кількості простих завдань, таких як запуск таймерів і відтворення музики.
Згодом Google зрозумів, що більшість людей використовували голосового помічника лише для обмеженої кількості простих завдань, таких як запуск таймерів і відтворення музики, сказав колишній менеджер. У 2020 році, коли Прабхакар Рагхаван, виконавчий директор Google, очолив Google Assistant, його група переорієнтувала віртуального компаньйона як характерну особливість смартфонів Android.
У січні, коли материнська компанія Google звільнила 12 000 співробітників, команда, що працює над операційними системами для домашніх пристроїв, втратила 16 відсотків своїх інженерів.
Багато великих технологічних компаній зараз поспішають запропонувати свої відповіді на ChatGPT. У штаб-квартирі Apple минулого місяця компанія провела щорічну конференцію по ШІ, внутрішній захід для співробітників, щоб дізнатися про його велику мовну модель та інші інструменти. Багато інженерів, включаючи членів команди Siri, щотижня тестували концепції створення мови, кажуть люди.
Багато великих технологічних компаній зараз поспішають запропонувати свої відповіді на ChatGPT.
У вівторок Google також заявив, що незабаром випустить генеративні інструменти ШІ, які допоможуть компаніям, урядам і розробникам програмного забезпечення створювати програми з вбудованими чат-ботами та впроваджувати базову технологію у свої системи.
У майбутньому технології чат-ботів і голосових помічників будуть зближатися, вважають експерти зі ШІ. Це означає, що люди зможуть керувати чат-ботами за допомогою мови, а ті, хто користується продуктами Apple, Amazon і Google, зможуть просити віртуальних помічників допомогти їм у роботі, а не лише у таких завданнях, як перевірка погоди.
У майбутньому технології чат-ботів і голосових помічників будуть зближатися.
«Ці продукти ніколи не працювали в минулому, тому що ми ніколи не мали можливостей діалогу на рівні людини», — сказав Аравінд Срінівас, засновник Perplexity, стартапу, який пропонує пошукову систему на основі чат-бота. «Тепер ми маємо».
Кавер: Patrick Edell