- 14 декабря 2016
- просмотров 1997
Группа учёных из Университета Кобленц-Ландау (Universität Koblenz-Landau, UKL) и Лейбницкого института социальных наук (GESIS — Leibniz-Institut für Sozialwissenschaften) создала онлайн-сервис
Wikiwhere, который позволяет определять географическую ориентированность статей Википедии (Wikipedia) — источники из каких стран и на каком языке используются авторами в первую очередь, во вторую и так далее, информируют
Daily Mail и другие СМИ со
ссылкой на публикацию результатов исследования в ArXiv.
Принцип работы инструмента прост: в поисковую строку Wikiwhere следует вставить ссылку на статью Википедии и нажать на кнопку «Get Analysis». В итоге появится страница с картой стран, окрашенных в диапазоне от красного к синему (больше источников — меньше) либо серым цветом (государства, источники которых не привлекались к написанию публикации). Далее следуют графики и таблицы с общей и детальной информацией по странам, IP-адресам (страны хостинг-провайдеров), доменным зонам и языкам источников.
Таким образом можно сравнивать статьи на одну и ту же тему из нескольких
языковых разделов Свободной энциклопедии. Для примера учёные продемонстрировали разницу в статьях о присоединении Крыма к Российской Федерации в 2014 году из
английской и
немецкой версий Вики. Выяснилось, что в немецкой Вики используется больше российских источников нежели украинских (
31 против
13), а в англоязычной всё обстоит с точностью до наоборот (
79 против
94). В итоге
может иметь место разница в изложении информации о том или ином факте, событии.
|
Сравнение тепловых карт в английской (слева) и немецкой (справа) версиях статьи о присоединении Крыма к России в 2014 году. Красный цвет — больше источников, синий — меньше. Сервис Wikiwhere |
Стоит отметить, что в определении географической привязки источника авторы разработки полагаются не только на IP-адрес сайта. Для максимально точной информации о локации источника применяется искусственный интеллект — алгоритм машинного обучения на основе специализированных запросов к базе данных DBpedia, всемирному хранилищу структурированных данных.
Однако пока прогностическая модель поддерживает лишь некоторые языки, что связано с ограниченными возможностями DBpedia: английский, немецкий, французский, итальянский, испанский, украинский, словацкий и нидерландский.