Продолжая тему Siri, хочу опубликовать перевод статьи Дага Киттлауса, человека, который является фактически ко-создателем Siri, и который был генеральным директором компании Siri, которую приобрела Apple в 2010 году. Его статья хорошо иллюстрирует то, почему Apple выкупила Siri и внедряет ее в свои устройства, и почему Стив Джобс так интересовался этой технологией. Более того, если Siri будет развиваться в том направлении, о котором пишет Даг, я бы на месте Google нервничал или, как минимум, лихорадочно искал/изобретал бы похожую технологию, потому что в будущем Siri может нести угрозу именно для поисковых механизмов, и это будет гораздо интересней, чем простой поиск, которым мы пользуемся сегодня. И да, будет там русский, и тогда это все станет для многих из нас еще актуальней.
————
Десятилетиями Голливуд изображал компьютеры, с которыми человек мог разговаривать, давать задачи и управлять им. Помните HAL 9000, KITT из машины, COMPUTER из Star Trek, или тот же идеально задуманный и визуализированный “Knowledge Navigator” двадцатилетней давности? Рассвет наступает.
Поприветствуем Siri.
Реакция на Siri превзошла даже наше воображение… А у меня оно смелое. Я считаю, что неслучайно Siri захватывает так, как это происходит в ее случае. Это прикольно, она работает хорошо для большинства, и превращает сложные взаимодействия в простые. И хотя я не знаю, что Apple планирует делать с Siri в будущем, можно быть уверенным, что она будет становиться лучше и делать больше. Я буду первым в очереди за iPhone 5, 6 и 7, чтобы заполучить новейшую версию Siri. (Или даже лучше, я просто попрошу Siri прислать мне последнюю версию iPhone, когда она станет доступной).
[ad#intext-inside]
Но это только начало. Я считаю, что когда вырастут наши дети, они будут удивленно спрашивать у нас, как мы могли вообще жить без виртуальных помощников, которым можно передать простые задачи нашей жизни — точно также, как мы с трудом можем представить себе жизнь без интернета, гуглежа и ноутбука. По мере развития качества систем, вы увидите появление специфических конкурентов, появляющихся в различных вертикальных структурах, где разговорное взаимодействие может упростить сложные интеракции. Подумайте о банковской сфере, где Европейский банк уже агрессивно инвестирует в автоматизированных виртуальных клерков, об электронной коммерции, где появляются свидетельства того, что Amazon движется по направлению к продажам на базе разговорной речи. Не забывайте о виртуальных агентах по путешествиям, виртуальных специалистах поддержки вроде VirtuOz, или даже виртуальных медсестрах, которые будут олицетворять видение Винода Хосла (Vinod Khosla) о докторе Алгоритме. Этот мир приближается к нам, и очень быстро. Но почему?
Потому что интеллектуальный виртуальный ассистент — это фактическая эссенция цифрового будущего.
Это все потому, что такой ассистент элегантно собирает в себе мириад элементов, которые мы хотим видеть в приложениях и интернет-сервисах, такие как персонализация, простое взаимодействие, контекстная осведомленность и интегрированные дейстия… все это заключенное в одном простом разговоре. К примеру, если мы используем кусочек разговора с воображаемым виртуальным помощником по поездкам, вы увидите как объединяются несколько аспектов услуг:
“Даг, твой рейс задерживается на 2 часа 30 минут. Найти тебе номер в гостинице поблизости? Я могу проверить другие рейсы в том же направлении.”
Чтобы обеспечить эту, на первый взгляд простую задачу, интегрируется понимание времени, места, контекста, персонализации, так и интеграция статуса рейса, бронировки гостиницы и доступные рейсы. Если мы продолжим в этом направлении, можно представить себе подобное продолжение разговора:
“Я нашел(ла) место до Сиэттла в пятницу 3 октября, отправление в 8.30 утра. Я запросил(а) место ближе к проходу и апгрейд по карте постоянного клиента, как обычно”.
Опять же, этот отрывок разговора показывает знание направлений для путешествия, пожелания к месту, использование статуса постоянного клиента, и возможность резервирования билета в одном простом разговоре. Чтобы реализовать что-то подобное в сегодняшних смартфонах, потребовалось бы немало заполнения всевозможных форм, как минимум, 3 или 4 приложения и гораздо больше времени и действий.
Представьте себе волшебство, которое происходит, когда ваш виртуальный помощник знает ваши предпочтения во множестве сфер, ваших друзей, вашу кредитную карту, ваш адрес, музыкальный вкус и множество другой информации о вас, и динамически применяет эти знания в любой задаче, которая возникает во множестве доступных услуг и приложений.
– “Отправь чек в PG&E на 89.47 долларов”
– “Сообщи мне, когда поблизости будет выступать Sting”
– “Купи биографию Стива Джобса и отправь ее моему брату”
– “Организуй мне визит к врачу после обеда где-то во второй половине следующей недели”
– и тд. и тп.
[ad#intext-inside]
Вот тут-то и наступит финал. Вы не сможете вернуться к старому способу решения задач. Когда возникнет платформа, которая интегрирует веб с разговором и пониманием, пользовательская парадигма сменится и возникнет более добрая, более мягкая версия HAL 900 как норма. Один интересный вопрос, который остается непроясненным, заключается в том, получит ли мир один гигантский искусственный интеллект, который будет присматривать за всеми нашими потребностями, объединяя различные вертикальные сегменты в единую мозаику искусственного интеллекта, или же нам будет доступно множество помощников по нашему зову. Как элегантно отметил Джон Баттелль (John Battelle), “будущее поиска — это не поиск, это разговор с тем, кому мы доверяем”. И хотя я не уверен, думал ли он об этом конкретном примере, это прекрасный способ резюмировать предстоящий век виртуальных помощников с искусственным интеллектом.
Оригинал
Discover more from alexmak.net
Subscribe to get the latest posts sent to your email.
Я уже пользуюсь Siri во всю. Как-то лень открывать приложения стало 🙂 все встречи назначаю голосом. Особенно когда в машине еду.
Вспомнился фильм “Я, робот” почему-то. Вообще жутковатая романтика на самом деле 🙂
Спасибо. любопытно и, как ни странно, реально 🙂
Вот щас отправлял голосом смс 😉
Все конечно здорово, но я думаю что первым делом во все доступные места влезет реклама, а мне бы этого не хотелось.
“Я проложила маршрут самым удобным образом – вы можете побывать ов всех магазинчиках Проктор и Доктор где я для вас забронировала зубные щеточки для труднодоступных мест, исходя из вашего досье они должны вам очень понравиться”
Если эта штука будет от гугла, то будь уверен, что так оно и будет:)
Скука. “101 способ потратить еще чуть-чуть со своей овердрафтной кредитки”.
Сколько раз в году вы летаете самолетом? Сколько раз в жизни бронировали номер в гостинице, даже не удосужившись поинтересоваться его фотографиями/удобствами/ценой?
Как часто вы покупаете книги, даже не интересуясь что там у них внутри?
Про выступление “поблизости” Стинга / Элвиса / Майкла Джексона / Уитни Хьюстон я вообще молчу.
Это всего-лишь говорит о бедноте и серости нашей Российской жизни. Посмотрите Американские фильмы – там повышение по должности спокойно сочетается с переездом в другой город. Обучение в колледже – 100% переезд в другой город или штат. Встреча с друзьями или родственниками – сел в самолет и полетел. В США(а это основной рынок Эпл), да и в Европе мобильность населения намного выше. Если нет границ(ЕС) и дешевые перелеты/переезды, хорошие дороги, то почему не провести выходные в Париже или другом штате? Сел и поехал.
Пока в нашем быту перелет на самолете равен празднику. Зачастую люди латали несколько раз в жизни всего и то в советское время. Нынче же билеты дороги, а зарплаты низкие.
Для меня было откровением, что в Аэропорту Цюриха и Берлина(пока я ждал пересадку) люди занимались повседневными делами. Говорили по ББ и заполняли какие-то бумаги, общались между собой и пр. Т.е. вели себя так, как будто ничего особенного не происходит, сейчас подойдет воздушный «автобус», ребята проедут пару остановок и выйдут.
Короче посыл мой такой: существует такая жизнь, о которой мы из-за своей серости не можем:( Надеюсь это будет меняться.
Это все замечательно, конечно, но без инфраструктуры Siri бесполезна. Она не может решать или оценивать. Она берет то, что уже известно и где-то лежит и выводит это на экран. Это будет какая—то очевидная ошибка или нелогичность, то Siri не сможет это осознать. Т.е. что бы действительно облегчить жизнь нужен ИИ. А до его создания вроде как еще оооочень далеко.
Сейчас же в мире царит хаос стандартов, протоколов и т.п. Siri можно приучить к парочке мест откуда она будет черпать информацию, но заставить собирать эту информацию из разных источников, анализировать и сравнивать полученные данные, ее научат ой как не скоро. Т.е. ни о каком цифровом будущем говорить еще не приходиться. Кст главное ошибка человека будет слепое доверие машине вроде Siri.
чего-то иного от со-создателя сервиса и не ожидал, но тут много проблем:
1) приватность данных / проблема Большого Брата. Было много шума из-за того что какая-то безобидная программка загрузила контакт-лист себе на сайт, или Гугл выдал новый супер-персональный поиск, а тут будет все еще круче
2) распознование голоса довольно паршивое
3) ИИ одно название, никакого прорыва пока нет и не ожидается
1. Эта проблема, по-моему, является проблемой исключительно для параноиков (большинство из них, при этом, почему-то создают «культ личности» компании, которая больше всех заинтересована в сборе этих данных — парадокс прямо какой-то).
2. У нее не распознавание голоса довольно паршивое, у нее паршивое распознавание рязанского английского.
3. Еще один интересный момент. Почему некоторые (особенно люди из скобок пункта 1) так любят выдирать слова из контекста. Автор заметки нигде не пишет, что ИИ уже есть, он прямо противопоставляет ИИ и множество помощников, оставляя пока возможность первого под вопросом. Или ты много букв не осилил?
1) с чего ты (раз уж мы на ты) решил что я фанат гугла (или любой другой компании) 2) это текущее положение дел, поэтому в той же сири на выбор несколько вариантов английского, а разговор сразу на нескольких языках еще более сложен 3) ии связан с 2-м пунктом, человек быстро адаптируется к произношению, плюс без ИИ мечты о цифровом помошнике так и останутся мечтами.
так что дружок гуманитарий, все это не просто
1. Из твоих аргументов.
2. У меня коллега с ней вполне сносно общается при его смешном английском. Мои друзья, хорошо говорящие по-английски (и для которых это родной язык), проблем с ней не имеют вообще. Да, ежу понятно, что сильный акцент (будь это рязанский английский или английский какого-нибудь гангстерского гетто с его жаргоном) или дислалия будут сильно мешать. Siri тут причем только? Любое механическое распознавание голоса ориентируется на стандартный (т.е. распространенный) для общества диалект языка. Давай, заяви еще, что Siri хреново понимает английский, потому что с ней не может общаться немой пользователь.
3. Цифровой помощник, как мы видим на примере Siri вполне возможен. От ИИ зависит только круг задач, которые этот помощник сможет решать, но никак не существование помощника вообще.
Я как гуманитарий, в отличии от тебя негуманитария, не приписываю собственный смысл к написанному автором и не оспариваю затем это.
1. Угроза приватности возникла при появлении банковской платёжной системы, вопрос утечки этой информации возник с появлением касс и банкоматов. Так или иначе этот вопрос решается, но опасения понятны. Главное не раздувать их до паронойи.
2. Распознование на удивление неплохое. На Android в youtube у меня почему-то постоянно вылазил Иванецкий вместо Жванецкий 🙂
3. ИИ есть, название или алгоритм можно определить ответами на запросы. Как известно правильно поставленный вопрос содержит в себе половину ответа 🙂
да, и преимущества однозначно есть, и вопросов много.. И для меня основной в том, чтобы люди не перестали уметь самостоятельно решать и выполнять простейшие задачи, чтобы у нас не атрофировалось многое человеческое. Ведь не всегда выполнение таких рутинных и простеньких задач, как выбор рейса, поиск фильма, происходит автоматично. Мы можем по пути наткнуться на что-то очень важное для нас, то, что мы не держали в “списке своих предпочтений”, но что привлечет наше внимание, что вдруг захочется посмотреть поподробнее, а там оно, смотри, и может вывести на какие-нибудь новые абсолютно не ожидаемые вещи… А иначе мы можем стать буквально рабами своих же программ, и вылезать из них, действовать нестандартно, находить новые пути и новые способы действий может стать намного более сложным, чем сейчас.
Весь прогресс человечества есть история того, как люди избавляются от необходимости решать рутинные простейшие задачи.
Может и рабами, а может легче будет удерживать фокус на поставленной задаче и при поиске информации более эффективно отфильтровывать шум.
Может и рабом, а может поможет удерживать фокус на поставленной задаче и при поиске информации более эффективно отсеивать шум.
Что-то мне подсказывает что “выбор рейса” или “поиск фильма” являются техническими достижениями нашей современности а не далекого прошлого и не “много человеческого”. Если бы люди начали просить Сири нарубить дров то это заставило бы еще задуматься о перегибах.
Это в очередной раз доказывает что для вас интернет и поиск информации является достаточно естественным явлением. Собственно, почему бы тоже самое не далать голосом.
Я с нетерпением жду того времени когда можно будет смело отказаться от механических устройств ввода информации (запроса) таких как буквенно-цифровая клавиатура, мышь и пр.
Почему-то такой способ общения с данными как Microsoft Kinnect не вызывает дискуссий с заголовками из серии “а надо ли..” или “атрофирование много человеческого”, хотя система из той же области.
На мой “дурной” вкус голосовое и визуальное взаимодействие с информацией больше взывает к “многому человеческому” чем клавиатура с мышью….
Я так же не сомневаюсь что виртуализация процессов в заимодействия с глобальным информационным полем является совершенно очевидным и единственным прогрессивным развитием технологий и их всеобщей интеграцией друг в друга.
А Сири всего лишь одно из многих решений. Но очень важное, т.к. речь является одним из важнеишх способов обмена опытом и способствует развитию мирового информационного пространства…
“Вот тут-то и наступит финал. Вы не сможете вернуться к старому способу решения задач.”… В точку! И при таком раскладе простое отключение электроэнергии (как оно часто бывает “внезапно”) приведёт к полному коллапсу — “по-старинке” мыслить и соображать уже никто уметь не будет.
Если отключить в Москве свет, коллапс наступит и без всякого Siri. А если воду, то и в LA никто про Siri не вспомнит. Ваш пример некорректен.
А Вы умеете пользоваться логарифмической линейкой? Между прочим отличный энергонезависимый вычислитель.
Не забывайте про это. Человечеству понадобится это знание, когда Skynet начнет войну.
– Отправь чек в PG&E на 89.47 долларов- Ok
– Ой, нет-нет, не им же, е-мае!
– Sorry, i don’t understand…
И картинка trollface.jpg 😀
А вообще отличная штука. У нас пока что только лишь для баловства, но каков потенциал!
Эту Сири еще улучшать и улучшать, я лично совершенно не понимаю восторженного визга по этому поводу. Максимум как я ее использую – установить будильник или надиктовать короткое смс. Подчеркиваю – короткое, на большее Сири неспособна. Лично для меня было бы огромным удобством надиктовывать емайлы, и такая возможность есть. Но проблема в том что Сири не распознает интонации голоса. То есть несколько фраз она строит в одну большую, без знаков препинания. А в моем случае еще немецкий, где каждое существительное с заглавной буквы пишется. Последующая за диктовкой корректировка просто сводит на нет эту возможность.
Вроде говорят что это пока бета-версия, надеюсь именно на данном аспекте разработчики сконцентрируют внимание.
А что, правда кто-то думает, что если выпускается какой-то продукт или технология, то оно так и остается в дальнейшем без какого-либо развития? Вроде же очевидные вещи, что все улучшается вместе с технологиями, алгоритмами и прогрессом в целом. Очевидно, так же, что и Siri будут улучшать.
«Визг» здесь по одной простой причине — появилась технология (распознавание речи было известно давно), которой, во-первых, можно пользоваться; а во-вторых, можно пользоваться без особого геморроя практически любому пользователю.
Сири – обучаемая система, поэтому “улучшать и улучшать” придется вам, а не разработчикам….
Если вы думаете, что вам подадут систему с уже зашитым запасом мировых знаний, то могу вас прямо сейчас в этом разочаловать. И это как ни странно так задумано разработчиками. А публичное бета-тестирование происходит не только и не столько из-за сомнений в Apple, сколько для сбора и анализа типов запросов и построение моделей их решения.
Сири – это такой современный продвинутый “томагочи” …. теперь он умеет палку приносить а не только “скулить” и “жрать” ….
да уж, навороченная штука. верю, особенно после такого – http://27.media.tumblr.com/tumblr_lucz8loNVQ1r4eoiuo1_250.png
Да кстати, для занесения событий в календарь она тоже не годится. Что бы я ни называл – репетиция, клиент или еще что-то, она все равно предлагает на определенное время установить “встречу”. У меня таких встреч на дню и на неделе не счесть, поэтому нужно конкретно писать что именно запланировано. Тут Сири тоже не помощник, ибо нет никакого толку переименовывать вручную слово “Встреча” на что-то другое. С таким же успехом я могу изначально все сам написать.
В общем, кто бы что ни говорил, это лично мое мнение, но зрелище на данный момент удручающее.
А встреча с репетицией, встреча с клиентом, встреча с еще чем-то?