Внезапный интерес Google к вашим фото

У меня сложные отношения с Google как компанией, которая знает слишком много обо мне и использует эти данные для того, чтобы “продавать меня” рекламодателям. С одной стороны, их сервисы, безусловно, удобные и полезные, а с другой – от незнания того, что именно там Google делает с моими данными иногда прямо мороз по коже. С Facebook, кстати, та же история, только у них еще и ленту невозможно читать, поэтому я этого по возможности избегаю. С Apple все не так однозначно, Apple неоднократно демонстрировала, что приватность пользователей она ценит гораздо больше, чем “рекламные агентства” на буквы G и F, но даже с ними я стараюсь ограничивать то количество информации, которое я добровольно отдаю компании. Это вызывает определенные неудобства, так как многие современные сервисы рассчитаны как раз на то, что ты “отдаешься им полностью”, а они уже “сделают тебе хорошо”, но лучше я пока буду с паранойей, а там посмотрим.

Вот Google Photos — один из таких сервисов. На поверхности — чертовски удобный, и гораздо лучше, чем то, что предлагает Apple, но почему-то от него ощущение, как говорят американцы, creepy as hell. Конечно, фотографии как дополнение к почте, к которой уже имеет доступ Gmail, не кажутся большой трагедией, но неизвестность все равно напрягает. Я наткнулся на хорошую статью по этому поводу, которая, как мне кажется, отражает мое беспокойство, и решил её перевести, чтобы беспокойно было не только мне. Статья довольно взвешена и без панических ноток.

————————–
Google часто пробует много разных идей, а затем собирает урожай данных из того, что взлетело. В данный момент компания пирует на фотографиях и видео, которые пользователи загружают через весьма популярное приложение Google Photos. Облачный сервис, собранный из обломков так и не выстрелившей социальной сети Google+, теперь может похвастаться 500 миллионами активных пользователей в месяц, которые добавляют 1,2 миллиарда фотографий в день. Траектория роста позволит этому сервису скоро войти в “клуб миллиардеров”, таких как Youtube, Gmail и Chrome. Никто точно не знает, что Google планирует делать со всеми этими фотографиями в долгосрочной перспективе, и вполне возможно, что компания сама еще с этим не определилась. Но в рамках ландшафта, где доминирует искусственный интеллект, данные — а в этом случае ваши фотографии — становятся наградой сами по себе.

На ежегодной конференции для разработчиков I/O Google расхваливала Photos как основную платформу, которой досталась масса ценных обновлений. Пользователи скоро смогут автоматически делиться всеми загруженными фотографиями со своими партнерами, или фильтровать по дате или теме определенные фотографии, которые будут доступны другим. Новая функция “Рекомендуемый доступ” будет использовать распознавание лиц для того, чтобы предлагать пользователям отправить фотографии друзей им напрямую, как это делает приложение Facebook Moments. Сервис уже применяет алгоритмы машинного обучения, чтобы классифицировать объекты на фотографиях и делать их доступными для поиска, так что пользователи могут легко найти фотографии собак, пива или закатов солнца. С такими функциями и неограниченным пространством для хранения Google Photos становится самым удобным, мощным вариантом для управления большой библиотекой фотографий. Ничего удивительного, что пользовательская база растет так быстро. (Хотя у меня есть свои сомнения по поводу того, насколько “активны” пользователи — Photos предустановлена на устройствах с Android и автоматически собирает ваши фотографии; я в основном использую сервис для того, чтобы найти пароль к аккаунту HBO отца моего друга, скриншот которого я сделал когда-то в 2014 году).

Но вопрос остается: почему Google предлагает такой функциональный продукт, который не выглядит на данный момент “монетизируемым”, если не считать фотоальбомов, которые компания планирует продавать? Самый простой ответ на него — компания хочет, чтобы люди оставались в рамках их всеобъемлющей экосистемы. Сегодняшние технологические гиганты предлагают быть смотрителями нашей цифровой жизни с помощью набора сервисов, в обмен на доступ к нашей личной информации. “Даже если Google не зарабатывает деньги напрямую на том, что она предлагает, она все равно собирает данные”, говорит Педро Домингос, профессор компьютерных наук университета штата Вашингтон, и автор книги The Master Algorithm. “В эти дни во множестве компаний данные считаются основным активом”.

Куда уж Google больше данных? Поисковой гигант, по сути, достиг своей стратегической цели по “организации информации в мире”, если говорить о текстах. Но даже сооснователь Ларри Пейдж признает, что формулировка миссии компании устарела. В интернете начинает доминировать “визуальное общение”, где лидируют такие компании, как Facebook, Instagram и Snapchat. Google Photos, особенно сейчас, когда там доработана функциональность общего доступа, является черным ходом в мир социальных сетей и функциональности общения, в который Google безуспешно пыталась прорваться последние лет 10. Мы разрешаем компании пассивно следить за нами с помощью платформ вроде Chrome и Maps, а Google Photos может стать первым продуктом Google после Gmail, который убедит людей массово и активно делиться своей персональной информацией с компанией.

Однако, данные, полученные из фотографий, потенциально могут содержать больше деликатной информации, чем то, что хранится в почте. У Google уже есть достаточно фотографий объектов, которые компания проиндексировала по всеми интернету с помощью своего поискового механизма, но она все еще не знает достаточно много о том, как выглядят отдельные люди. Для того, чтобы доступ и маркировка фотографий работала, Google нужно проанализировать лицевую структуру субъекта и создать для них уникальный “лицевой отпечаток”. Компания на данный момент судится в штате Иллинойс по поводу того, что их технология распознавания лиц нарушает закон штата о защите биометрических данных граждан, и эта технология пока недоступна во многих странах Европы как раз из-за опасений в нарушении законов о приватности.

Возможность быстро отсортировать людей, места и объекты — суть аргументации за использование Google Photos, конечно же, и распознавание лиц помогает достигать этой цели. Но по мере того, что как технологии ИИ Google становятся более навороченными, компания плетет все большую сеть реляционных данных о мире. Какая-то информация подается пользователями (вы сами можете идентифицировать свое лицо в Photos или отметить лица друзей), но многое происходит за счет неизвестных расчетов алгоритмами компании, которые разработаны быть самообучаемыми, точно так же, как человек может использовать текущую информацию для интерпретации новой информации. Если я ищу “мама” в моей библиотеке Google Photos, сервис выдает фотографию, где мы сидим с ней в ресторане в октябре прошлого года, которую я точно не отмечал меткой “мама”. (Я попросил у Google пояснения, как это получилось. Представитель Google ответил, что Google Photos не использует анализ лицевой структуры, чтобы находить семейные сходства, и что в моем случае так могло получиться, потому что характеристики фото соответствуют изображениям, отмеченным как “мама” в базе данных поиска публично доступных фото в интернете). Аккуратная идентификация моей мамы — это пример того, как системы машинного обучения Google становятся умнее. И еще это крайне стремно.

“Компании постоянно экспериментируют, чтобы понять, что они могут сделать”, говорит Домингос. “Apple утверждает, что они целиком за приватность пользовательских данных. Facebook более бесцеремонный. Google где-то посередине. Они не знают, с чем люди будут готовы мириться, поэтому они сейчас в процессе выявления пределов”.

Пока что Google Photos тренируются в “оффлайне”, что означает, что загруженные пользователями фотографии не скармливаются системам ИИ Google для помощи им в распознавании объектов (компания использует для этого результаты поиска изображений). Но то, как работает Google Photos сейчас, будет отличаться от функциональности сервиса в будущем, и идеи, которые звучат посягающими на приватность сегодня, могут выдаваться за инновации завтра. В 2009 году одна из ежегодных первоапрельских шуток Google заключалась в программе ИИ, которая может сканировать почту пользователей и автоматически писать соответствующие ответы. В 2015 году эта надуманная концепция была добавлена в приложение компании Inbox, и на прошлой неделе её выкатили в Gmail. Когда Google начала исследовать распознавание голоса, она чувствовала необходимость просить пользователей пожертвовать им свои записи голосовой почты из сервиса Google Voice для исследований. Сегодня компания сохраняет все голосовые поисковые запросы по умолчанию, и использует их для обучения своих систем ИИ. Компания утверждает, что подобные сценарии не представляют собой поводов для беспокойства с точки зрения приватности, потому что сообщения людей и их голоса прослушиваются компьютерами, а не людьми.

Клише для критики бесплатных интернет-платформ всегда было “вы являетесь продуктом”. Сегодня более точно было бы сказать “вы являетесь ресурсом”. Довольно длительное время мы переживали, что технологические гиганты могут продавать нашу личную информацию тому, кто предложит больше всего денег. Но когда в Кремниевой Долине основной упор идет на искусственный интеллект, данные сами по себе становятся ценной валютой. Andrew Ng, исследователь, который основал проект ИИ Google Brain, недавно назвал данные “дефицитным ресурсом”. Компании, у которых их больше всего, могут создавать сложные системы машинного обучения, на основе которых будут работать базовые потребительские технологические продукты. Компании, у которых данных недостаточно, возможно, никогда не смогут этого сделать, раз уж мы хорошо зафиксированы в лагере Google, Amazon, Facebook или Apple. “Все эти компании обладают преимуществом, потому что у них уже есть огромные массивы данных, и у них нет необходимости делиться ими с кем-либо”, говорил Алекс Рудницкий, профессор факультета компьютерных наук университета Карнеги Меллон. “Чтобы получить данные, им нужно предложить что-то ценное пользователям. И это не так-то просто реализовать. Они получают данные, а затем могут использовать их для продвижения новых продуктов, которые используют эти данные для чего-то другого”.

Весь процесс разработки в Google трансформируется в эту модель. Все применения ИИ, упомянутые ранее — распознавание лиц, автоматические ответы на почту, понимание голосовых команд — все это организовано в рамках большого фреймворка машинного обучения под названием TensorFlow. Компания делает ставку на эту систему, уменьшая её так, чтобы она могла работать на телефоне Android, который не подключен к интернету, и масштабируя её до того уровня, где она обеспечивает работу нового процессора ИИ, который позволит сторонним компаниям использовать прогресс в машинном обучении Google через облако. Вместо создания набора раздельных алгоритмов, выполняющих отдельные задачи, Google хочет изобрести всеобъемлющий ИИ, который может справляться с разными задачами так, как это делают люди. “Со временем мы обнаружили, что те же подходы и алгоритмы машинного обучения, которые решают проблемы в одном направлении, могут быть использованы во множестве других направлений и продуктов”, говорит Джефф Дин, лидер исследовательской компании Google Brain в своем посте в марте этого года. “Так что то, что вы видите — это скачкообразный рост применения машинного обучения везде в Google, сотни команд и тысячи разработчиков используют эти подходы машинного обучения для решения проблем в своих сферах”.

Это мощные прорывы, которые, похоже, ускорят темы технологических изменений. Но важно помнить, что их проводит компания, чья основная цель — продажа адресной рекламы. После того, как продукт Google проходит достаточное количество итераций, всасывая достаточное количество данных, он должен начать приносить деньги, будь то в форме рекламируемых точек, которыми забиты Google Maps, или ассистент Google Home, который без спроса играет вам рекламный ролик фильма “Красавица и Чудовище”.

Лидеры технологических компаний любят говорить, что мы находимся “в самом начале” инноваций, которые они демонстрируют. Мы также находимся и в начале пути, где они пытаются понять, как на этом заработать. Фотоальбом раньше был просто альбомом с фотографиями. Теперь это база данных с поиском, которая достаточно сообразительна, чтобы сделать заключение об отношениях людей на фото. Чем он будет завтра и кто за это заплатит? Этим вопросом надо задаваться каждый раз, когда Google и её коллеги показывают новый, слишком-хорош-чтобы-быть-бесплатным продукт. “Сергей Брин говорит, что Google хочет быть третьей половиной вашего мозга”, говорит Домингос. “Но задумайтесь вот о чем: вы действительно хотите, чтобы третья половина вашего мозга зарабатывала показом вам рекламы? Я не хочу”.