- 5 декабря 2012
- новость года
- просмотров 10016
В мае текущего года Google
представил англоязычным пользователям инструмент для семантического поиска Knowledge Graph («граф знаний», «древо знаний»): в результат поисковой выдачи стала внедряться краткая сводка информации о объектах поиска, то есть для получения минимальной общей информации пользователь может даже не переходить на сайты по ссылкам. 5 декабря в официальном блоге Google Россия
объявил о запуске русской и шести других языковых версий системы (для немецкого, французского, португальского, итальянского, испанского и японского языков).
Например, теперь по запросу [
петр первый] пользователь сразу же узнает годы жизни царя, имена его родителей, главные события в его жизни, а также связи этого исторического деятеля с другими событиям и явлениями. По запросу [
венеция] справа от результатов поиска появится сводка данных о городе, которая формируется с учётом того, какую информацию пользователи чаще всего хотят видеть, когда вводят название города в поисковую строку. Например, отныне не придется выполнять еще один запрос, чтобы узнать погоду в городе. Если кликнуть на фотографию площади Сан-Марко, отобразится краткая справка об объекте, а над результатами поиска появится список других известных достопримечательностей города, среди которых появится изображение оперного театра «Ла Фениче». Если нажать на его фотографию, можно будет вкратце узнать и о нём. Система Knowledge Graph, получившая в России официальное название «Сеть знаний», описывает предметы, людей, места и понятия из реального мира и связи между ними. Система не просто ищет информацию по ключевым словам, а понимает смысл текста так же, как люди, используя знания об окружающем мире.
К открытию первой, англоязычной версии, «Сеть знаний» располагала информацией о 500 миллионах объектов и 3,5 миллиардах связей между ними. После запуска других языковых версий количество понятий, которые содержит и распознает разработка, увеличилось до 570 миллионов, а число связей между ними и отдельных фактов превысило 18 миллиардов.
Стоит отметить, что новация Google — далеко не первый и не единственный пример попытки создать так называемую «автоматизированную энциклопедию», «вычислительный движок знаний», который бы автоматически составлял статью с резюме о том или ином предмете поиска. Среди примеров — гибрид поисковых, справочных и интеллектуальных систем
Wolfram Alpha, «автоматизированная энциклопедия»
Cpedia, аудиовизуальная «энциклопедия»
Qwiki и другие. Однако данные для таких проектов берутся прежде всего из открытых источников; Google же, создавая «Сеть знаний», использует ещё и собственные, а также возможности лидирующего поисковика — статистику поисковых запросов пользователей.
В частности, руководитель команды качества поиска в российском представительстве Google
Ринат Сафин рассказал РИА Новости, что основным из открытых источников для поисковика является база данных Freebase. Также используются Википедия (Wikipedia), база данных ЦРУ (открытая информация о странах, городах, их населении, площади и т. п.) и собственные ресурсы, например, данные картографического сервиса Google Maps и социальной сети Google+.
Однако существует проблема релевантности справки Google к запросу. Например, при запросе [королев] пользователь может искать информацию как о человеке, так и о городе. Как рассказал Сафин, данная проблема решается путем изучения частоты пользовательских запросов — приоритет имеет тот объект, о котором чаще спрашивают. При этом, если одна интерпретация понятия важнее другой, это найдёт своё отражение в размерах карточек-справок с информацией Google. Если интерпретации равнозначные, размеры карточек будут одинаковыми.
При этом для владельцев десктопов, смартфонов и планшетов используется разный интерфейс «Сети знаний»: чем меньше экран, тем лаконичней будет справка, но при желании её всегда можно будет развернуть.
Хотя 5 декабря возможность воспользоваться «Сетью знаний» появилась не у всех пользователей, Google заверил, что это временное явление. «В среду данный инструмент появится у части пользователей, но через несколько дней им смогут воспользоваться все российские пользователи Google», —
заявили РИА Новости в пресс-службе компании.
Упомянутые персоны, псевдонимы и персонажи