Э

Мир энциклопедий

encyclopedia.ru

Китайские учёные разработали алгоритм проверки достоверности статей Википедии

3D-логотип Википедии
  • 7 августа 2014
  • просмотров 3821
  • комментариев 8
Китайские учёные из Колледжа компьютерных наук и технологий (College of Computer Science and Technology) Нанкинского университета почты и телекоммуникаций (Nanjing University of Posts and Telecommunications, NUPT) разработали алгоритм автоматической оценки достоверности статей Википедии (Wikipedia), говорится в аннотации к публикации в научном журнале International Journal of Information Quality.

Сообщается, что алгоритм, работающий на основе динамической байесовской сети (Dynamic Bayesian Network, DBN), проводит количественную, а затем и качественную оценку записей в онлайн-энциклопедии. В наши дни байесовский анализ обычно используется для оценки содержания писем на предмет спама.

С вероятностью до 80% можно определить, являются ли статьи и правки достоверными или нет, уточняет «Газета.Ru».

Исследователи уверены, что алгоритм может существенно повысить качество Википедии. При этом он применим в любой языковой версии проекта.
  • Теги
  • algorithm
  • automatic assessment
  • data quality
  • DBN
  • NUPT
  • Wikipedia
  • Википедия
  • автоматическая оценка
  • алгоритм
  • динамическая байесовская сеть
  • достоверность статей
  • качество данных
  • качество статей

(Голосов: 3, Рейтинг: 3.4)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Честно говоря, не понял, какую достоверность статей энциклопедии можно проверять таким способом. Допускаю, если это касается каких-то технических (в прямом или переносном смысле) данных, но как можно проверить достоверность исторических фактов? По-моему, китайцы на это раз перемудрили.
    • 0/0
  • Ссылка на комментарий
    Юрий Антипов пишет:
    Честно говоря, не понял, какую достоверность статей энциклопедии можно проверять таким способом. Допускаю, если это касается каких-то технических (в прямом или переносном смысле) данных, но как можно проверить достоверность исторических фактов? По-моему, китайцы на это раз перемудрили.
    Действительно, ЧТО выбрано разработчиками в качестве "эталона"? С ЧЕМ сравнивается-то на предмет "достоверности"? Вопрос
    Особенно в случаях с малоизвестными фактами или личностями, где источником информации единственно оказываются только они сами?
    Хотя в принципе, если это только — начало, то  дальнейшие проработки программы, может быть, и прояснят ее суть, а пока — всё довольно мутно.
    • 0/0
  • Ссылка на комментарий
    Крайне любопытно. Хотя меня, как и многих, терзают смутные сомнения. Проверить "лирику алгеброй " с таким высоким процентом достоверности не удавалось еще никому. И, интересно, где это

    ...байесовский анализ обычно используется для оценки содержания писем на предмет спама.

    Как пользователь, на куче ресурсов (и наших и буржунетных)  я наблюдаю старый добрый тест тьюринга (он же капча) и кнопочку "пожаловаться на спам" на разных языках.  С другой стороны, китайцы в последние годы всё чаще  радуют новыми интересными решениями. Будем посмотреть.

    Пока я с трудом представляю, как алгоритмизируется проверка "на вшивость" и на энциклопедичность, такой вот, к примеру, правочки.
    • 0/0
  • Ссылка на комментарий
    Ну вот, дожили: боты пишут нечто, что называют энциклопедией, и потом же такие же боты этот контекст проверяют. Куда идет наука?  Вопрос
    • 0/0
  • Ссылка на комментарий
    А в чем суть алгоритма и каковы его критерии? Не думаю, что он настолько эффективен и ему можно 100% доверять. Я вообще против, когда боты начинают оценивать человеческий труд и выносить свои вердикты,.. имхо.
    • 0/0
  • Ссылка на комментарий
    Интересное изобретение. Не совсем понятно, с чем онлайн-энциклопедию «Википедию» будут сравнивать. Не появится ли у кого-то желание и те данные проверить? Все запутано и кто знает, где та правда.
    • 0/0
  • Ссылка на комментарий
    Дан Василий пишет:
    А в чем суть алгоритма и каковы его критерии? Не думаю, что он настолько эффективен и ему можно 100% доверять. Я вообще против, когда боты начинают оценивать человеческий труд и выносить свои вердикты,.. имхо.
    Ну написано же, что до 80-ти процентов. При чем тут 100? Да и вообще, доверять Википедии на сто процентов — это очень большая глупость. В ней немало нелепостей и недостоверных фактов. А тут!? Ну на мой взгляд, лишний фильтр, который улучшит качество статей будет только на пользу.
    • 0/0
  • Ссылка на комментарий
    Насколько помню, Байесовский алгоритм как минимум нуждается в процедуре "обучения", на этом построены упомянутые фильтры спама. С проверкой достоверности статей все должно обстоять на порядки сложнее. Полагаю, что о практической реализации данной схемы контроля речь не идет. Пока это скорее научный казус из области искусственного интеллекта.
    • 0/0