Автор: Дитер Бон
На недавнем мероприятии Search On компания Google представила несколько новых функций, которые в совокупности являются ее самой глобальной попыткой заставить людей делать больше, чем просто набирать несколько слов в поисковой строке. Используя свою новую технологию машинного обучения Multitask Unified Model (MUM), компания надеется в итоге предоставлять более подробные и богатые контекстом ответы, а в ответ, как она надеется, пользователи будут задавать более подробные и богатые контекстом вопросы. Конечным результатом, как надеется компания, станет более богатый и глубокий опыт поиска.
Генеральный директор Google Прабхакар Рагхаван курирует поиск наряду с проектом голосового помощника, рекламой и другими продуктами. Он любит говорить — и повторил это в интервью накануне — что «поиск — это не решенная проблема». Возможно, это и так, но проблемы, которые он и его команда пытаются решить сейчас, имеют меньше отношения к работе в Интернете и больше — к добавлению контекста к тому, что человек ищет.
ИИ поможет Google изучить вопросы, которые задают люди
Со своей стороны, Google собирается начать использовать свою способность распознавать созвездия связанных тем с помощью машинного обучения и представлять их вам в организованном виде. Грядущий редизайн поиска Google начнет показывать блоки «Что нужно знать», которые будут отсылать вас к различным подтемам. Если в видео есть раздел, который имеет отношение к общей теме — даже если видео в целом посвящено другому — поиск направит вас к нему. Результаты покупок начнут показывать товары, доступные в ближайших магазинах, и даже одежду различных стилей, связанных с вашим поиском.
Со своей стороны, Google предлагает — хотя, возможно, лучше сказать «просит» — использовать новые способы поиска, выходящие за рамки текстового поля. Компания активно внедряет свою программу распознавания изображений Google Lens. Она будет встроена в приложение Google на iOS, а также в веб-браузер Chrome на настольных компьютерах. И с помощью MUM Google надеется заставить пользователей не просто определять цветы или достопримечательности, а использовать Lens непосредственно для того, чтобы задавать вопросы и делать покупки.
«Это цикл, который, как мне кажется, будет продолжать развиваться» — говорит Рагхаван. «Развитие технологий ведет к расширению возможностей пользователя, к большей выразительности и требует от нас большего в техническом плане».
Эти две стороны уравнения поиска призваны положить начало следующему этапу развития поиска Google, на котором алгоритмы машинного обучения будут играть более заметную роль, организуя и представляя информацию напрямую. В этом усилиям Google в значительной степени помогут последние достижения в области обработки языка ИИ. Благодаря системам, известным как большие языковые модели (MUM — одна из них), машинное обучение стало гораздо лучше определять связи между словами и темами. Именно эти навыки компания использует для того, чтобы сделать поиск не только более точным, но и более исследовательским и, как она надеется, более полезным.
Один из примеров Google весьма поучителен. Вы можете не иметь представления о том, как называются детали вашего велосипеда, но, если что-то сломалось, вам нужно это выяснить. Google Lens может визуально определить переключатель (деталь для переключения скоростей, висящая рядом с задним колесом), и вместо того, чтобы просто дать вам дискретную информацию, он позволит вам задать вопрос о починке этой детали напрямую, перенаправляя вас к информации (в данном случае к отличному Youtube-каналу Berm Peak).
Мультимодальный поиск требует совершенно нового вклада со стороны пользователей
Стремление к тому, чтобы пользователи чаще открывали Google Lens, интересно само по себе, но общая картина заключается в том, что Google пытается собрать больше контекста в ваших запросах. Более сложные, мультимодальные поисковые запросы, сочетающие текст и изображения, требуют «совершенно иного уровня контекстуализации, который должен быть у нас, провайдера, и поэтому нам очень помогает как можно большее количество контекста» — говорит Рагхаван.
Мы очень далеки от так называемых «десяти синих ссылок» в результатах поиска, которые предоставляет Google. Он уже давно показывает информационные блоки, результаты с изображениями и прямые ответы. Сегодняшние объявления — это еще один шаг, когда информация, которую предоставляет Google, является не просто рейтингом релевантной информации, а дистилляцией того, что понимают машины, изучая веб-страницы.
В некоторых случаях — как в случае с покупками — эта дистилляция означает, что вы, скорее всего, будете отправлять Google больше просмотров страниц. Как и в случае с Lens, за этой тенденцией важно следить: поиск Google все чаще подталкивает вас использовать собственные продукты Google. Но здесь есть и более серьезная опасность. Тот факт, что Google сообщает вам больше информации напрямую, увеличивает ответственность, которая всегда лежала на нем: говорить менее предвзято.
Под этим я подразумеваю предвзятость в двух разных смыслах. Первый — технический: модели машинного обучения, которые Google хочет использовать для улучшения поиска, имеют хорошо задокументированные проблемы с расовыми и гендерными предубеждениями. Они обучаются путем чтения больших массивов информации в Интернете и, как следствие, склонны воспринимать неприятные способы общения. Проблемы Google с командой по этике ИИ также хорошо известны — компания уволила двух ведущих исследователей после того, как они опубликовали работу на эту тему. Как сказал вице-президент Google по поиску Панду Наяк в статье Джеймса Винсента из The Verge, посвященной сегодняшним анонсам MUM, Google знает, что все языковые модели имеют предубеждения, но компания считает, что может избежать «выкладывания их на всеобщее обозрение».
Как бы то ни было это обходит стороной другой важный вопрос и другой тип предвзятости. Поскольку Google начинает напрямую сообщать вам все больше информации, полученной в результате синтеза, какова точка зрения, с которой он говорит? Как журналисты, мы часто говорим о том, что так называемый «взгляд из ниоткуда» является неадекватным способом представления информации. Какова точка зрения Google? Это проблема, с которой компания сталкивалась в прошлом и которая иногда известна как проблема «одного верного ответа». Когда Google пытается дать людям короткие, окончательные ответы с помощью автоматизированных систем, это часто приводит к распространению плохой информации.
Отвечая на этот вопрос, Рагхаван указывает на сложность современных языковых моделей. «Почти все языковые модели, если вы посмотрите на них, являются вкраплениями в пространство высокой размерности. Есть определенные части этих пространств, которые имеют тенденцию быть более авторитетными, и определенные части, которые менее авторитетны. Мы можем механически оценить эти вещи довольно легко» — объясняет он. По словам Рагхавана, проблема заключается в том, как представить пользователю некоторые из этих сложностей, не перегружая его.
Может ли поиск Google оставаться нейтральным, формируя короткие и четкие ответы пользователям?
Мне кажется, что реальный ответ заключается в том, что, по крайней мере сейчас, Google делает все возможное, чтобы избежать вопроса о точке зрения своей поисковой системы, избегая областей, где ее могут обвинить в, как выразился Рагхаван, «чрезмерном редактировании». Часто в разговорах с руководителями Google об этих проблемах предвзятости и доверия они фокусируются на более легко определяемых частях этих высокоразмерных пространств, таких как «авторитетность».
Например, новые поля Google «Что нужно знать» не будут появляться при поиске вещей, которые Google определил как «особо вредные/чувствительные», хотя представитель компании говорит, что Google не «разрешает или запрещает конкретные курируемые категории, но наши системы способны масштабируемо понимать темы, для которых эти типы функций должны или не должны срабатывать».
Поиск Google, его входы, выходы, алгоритмы и языковые модели стали почти невообразимо сложными. Когда Google говорит нам, что теперь он способен понимать содержание видео, мы принимаем это как должное, что у него есть вычислительные возможности для этого — но реальность такова, что даже просто индексировать такой массивный корпус — монументальная задача, которая превосходит первоначальную задачу индексирования раннего Интернета. (Для справки, Google индексирует только аудио-транскрипты подмножества YouTube, хотя с помощью MUM он намерен в будущем заняться визуальным индексированием и других видеоплатформ).
Часто, когда вы разговариваете с учеными-компьютерщиками, возникает проблема путешествующего коммивояжера. Это знаменитая головоломка, в которой вы пытаетесь вычислить кратчайший возможный маршрут между заданным количеством городов, но это также богатая метафора для размышлений о том, как компьютеры выполняют свои операции.
«Если бы вы дали мне все машины в мире, я мог бы решать довольно большие задачи» — говорит Рагхаван. Но для поиска, по его словам, эта проблема не решена, и, возможно, ее невозможно решить, просто использовав больше компьютеров. Вместо этого Google необходимо разработать новые подходы, такие как MUM, которые позволят лучше использовать ресурсы, которые Google может реально создать. «Если бы вы дали мне все существующие машины, я все равно был бы ограничен человеческим любопытством и познанием».
Новые способы понимания информации Google впечатляют, но проблема в том, что компания будет делать с этой информацией и как ее представлять. Самое забавное в проблеме странствующего коммивояжера — то, что никто, кажется, не останавливается и не спрашивает, что именно находится в чемодане, что он показывает всем своим клиентам, когда идет от двери к двери?
Оригинал: The Verge