Э

Мир энциклопедий

encyclopedia.ru

Учёные Германии запустили сервис-анализатор географических «пристрастий» статей Википедии

  • 14 декабря 2016
  • просмотров 1954
  • комментариев 3
Группа учёных из Университета Кобленц-Ландау (Universität Koblenz-Landau, UKL) и Лейбницкого института социальных наук (GESIS — Leibniz-Institut für Sozialwissenschaften) создала онлайн-сервис Wikiwhere, который позволяет определять географическую ориентированность статей Википедии (Wikipedia) — источники из каких стран и на каком языке используются авторами в первую очередь, во вторую и так далее, информируют Daily Mail и другие СМИ со ссылкой на публикацию результатов исследования в ArXiv.

Принцип работы инструмента прост: в поисковую строку Wikiwhere следует вставить ссылку на статью Википедии и нажать на кнопку «Get Analysis». В итоге появится страница с картой стран, окрашенных в диапазоне от красного к синему (больше источников — меньше) либо серым цветом (государства, источники которых не привлекались к написанию публикации). Далее следуют графики и таблицы с общей и детальной информацией по странам, IP-адресам (страны хостинг-провайдеров), доменным зонам и языкам источников.

Таким образом можно сравнивать статьи на одну и ту же тему из нескольких языковых разделов Свободной энциклопедии. Для примера учёные продемонстрировали разницу в статьях о присоединении Крыма к Российской Федерации в 2014 году из английской и немецкой версий Вики. Выяснилось, что в немецкой Вики используется больше российских источников нежели украинских (31 против 13), а в англоязычной всё обстоит с точностью до наоборот (79 против 94). В итоге может иметь место разница в изложении информации о том или ином факте, событии.

 Сравнение тепловых карт в английской (слева) и немецкой (справа) версиях статьи о присоединении Крыма к России в 2014 году. Сервис Wikiwhere
Сравнение тепловых карт в английской (слева) и немецкой (справа)
версиях статьи о присоединении Крыма к России в 2014 году.
Красный цвет — больше источников, синий — меньше.
Сервис Wikiwhere

Стоит отметить, что в определении географической привязки источника авторы разработки полагаются не только на IP-адрес сайта. Для максимально точной информации о локации источника применяется искусственный интеллект — алгоритм машинного обучения на основе специализированных запросов к базе данных DBpedia, всемирному хранилищу структурированных данных.

Однако пока прогностическая модель поддерживает лишь некоторые языки, что связано с ограниченными возможностями DBpedia: английский, немецкий, французский, итальянский, испанский, украинский, словацкий и нидерландский.
  • Теги
  • bias
  • DBpedia
  • geographical provenance
  • GESIS
  • online service
  • research
  • sources of information
  • UKL
  • Wikipedia
  • Wikiwhere
  • Википедия
  • географическая принадлежность
  • исследование
  • источники статей
  • необъективность информации
  • онлайн сервис

(Голосов: 1, Рейтинг: 3.3)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Любопытно.
    Теперь бы еще создать службу, которая, так сказать, "синтезировала" бы полученные сведения из всех источников и выдавала бы максимально полный вики-продукт. По идее-то именно ТАК и следовало бы работать над энциклопедическим текстом... Восклицание
    • 0/0
  • Ссылка на комментарий
    YA_HELEN пишет:
    Любопытно.
    Теперь бы еще создать службу, которая, так сказать, "синтезировала" бы полученные сведения из всех источников и выдавала бы максимально полный вики-продукт. По идее-то именно ТАК и следовало бы работать над энциклопедическим текстом...

    Да, любопытная программа. Политическую окраску статей определяет сразу и показывает наглядно. И получается, что Свободная энциклопедия не настолько свободна, преподнося события глазами определенных и вовсе не беспристрастных источников.
    • 0/0
  • Ссылка на комментарий
    Елена Крылова пишет:
    Да, любопытная программа. Политическую окраску статей определяет сразу и показывает наглядно. И получается, что Свободная энциклопедия не настолько свободна, преподнося события глазами определенных и вовсе не беспристрастных источников.
    Да вот как раз наглядности не очень-то и вижу. С одной стороны, противостояние один к 2.7 (утрированно), с другой, интерес 1 к 0.85. Так что никакой особой четкости не видно, и делать на основании этого выводы как-то сложно. Максимум что можно проверить, так это интерес к той или иной теме, но не более.
    • 0/0