Китайские учёные разработали алгоритм проверки достоверности статей Википедии

7 августа 2014
просмотров 3787
комментариев 8

Китайские учёные из Колледжа компьютерных наук и технологий (College of Computer Science and Technology) Нанкинского университета почты и телекоммуникаций (Nanjing University of Posts and Telecommunications, NUPT) разработали алгоритм автоматической оценки достоверности статей Википедии (Wikipedia), говорится в аннотации к публикации в научном журнале International Journal of Information Quality.

Сообщается, что алгоритм, работающий на основе динамической байесовской сети (Dynamic Bayesian Network, DBN), проводит количественную, а затем и качественную оценку записей в онлайн-энциклопедии. В наши дни байесовский анализ обычно используется для оценки содержания писем на предмет спама.

С вероятностью до 80% можно определить, являются ли статьи и правки достоверными или нет, уточняет «Газета.Ru».

Исследователи уверены, что алгоритм может существенно повысить качество Википедии. При этом он применим в любой языковой версии проекта.

Теги
algorithm
automatic assessment
data quality
DBN
NUPT
Wikipedia
Википедия
автоматическая оценка
алгоритм
динамическая байесовская сеть
достоверность статей
качество данных
качество статей

(Голосов: 3, Рейтинг: 3.4)

Юрий Антипов 7 августа 2014Ссылка на комментарий
Честно говоря, не понял, какую достоверность статей энциклопедии можно проверять таким способом. Допускаю, если это касается каких-то технических (в прямом или переносном смысле) данных, но как можно проверить достоверность исторических фактов? По-моему, китайцы на это раз перемудрили.
- 0 /0
YA_HELEN 8 августа 2014Ссылка на комментарий
Юрий Антипов пишет:
Честно говоря, не понял, какую достоверность статей энциклопедии можно проверять таким способом. Допускаю, если это касается каких-то технических (в прямом или переносном смысле) данных, но как можно проверить достоверность исторических фактов? По-моему, китайцы на это раз перемудрили.
Действительно, ЧТО выбрано разработчиками в качестве "эталона"? С ЧЕМ сравнивается-то на предмет "достоверности"? Вопрос
Особенно в случаях с малоизвестными фактами или личностями, где источником информации единственно оказываются только они сами?
Хотя в принципе, если это только — начало, то дальнейшие проработки программы, может быть, и прояснят ее суть, а пока — всё довольно мутно.
- 0 /0
Игорь Прохоров 10 августа 2014Ссылка на комментарий
Крайне любопытно. Хотя меня, как и многих, терзают смутные сомнения. Проверить "лирику алгеброй " с таким высоким процентом достоверности не удавалось еще никому. И, интересно, где это

...байесовский анализ обычно используется для оценки содержания писем на предмет спама.

Как пользователь, на куче ресурсов (и наших и буржунетных) я наблюдаю старый добрый тест тьюринга (он же капча) и кнопочку "пожаловаться на спам" на разных языках. С другой стороны, китайцы в последние годы всё чаще радуют новыми интересными решениями. Будем посмотреть.

Пока я с трудом представляю, как алгоритмизируется проверка "на вшивость" и на энциклопедичность, такой вот, к примеру, правочки.
- 0 /0
Роман Троцкий 11 августа 2014Ссылка на комментарий
Ну вот, дожили: боты пишут нечто, что называют энциклопедией, и потом же такие же боты этот контекст проверяют. Куда идет наука? Вопрос
- 0 /0
Дан Василий 11 августа 2014Ссылка на комментарий
А в чем суть алгоритма и каковы его критерии? Не думаю, что он настолько эффективен и ему можно 100% доверять. Я вообще против, когда боты начинают оценивать человеческий труд и выносить свои вердикты,.. имхо.
- 0 /0
Karina Golub 11 августа 2014Ссылка на комментарий
Интересное изобретение. Не совсем понятно, с чем онлайн-энциклопедию «Википедию» будут сравнивать. Не появится ли у кого-то желание и те данные проверить? Все запутано и кто знает, где та правда.
- 0 /0
lisss 12 августа 2014Ссылка на комментарий
Дан Василий пишет:
А в чем суть алгоритма и каковы его критерии? Не думаю, что он настолько эффективен и ему можно 100% доверять. Я вообще против, когда боты начинают оценивать человеческий труд и выносить свои вердикты,.. имхо.
Ну написано же, что до 80-ти процентов. При чем тут 100? Да и вообще, доверять Википедии на сто процентов — это очень большая глупость. В ней немало нелепостей и недостоверных фактов. А тут!? Ну на мой взгляд, лишний фильтр, который улучшит качество статей будет только на пользу.
- 0 /0
Shiga 12 августа 2014Ссылка на комментарий
Насколько помню, Байесовский алгоритм как минимум нуждается в процедуре "обучения", на этом построены упомянутые фильтры спама. С проверкой достоверности статей все должно обстоять на порядки сложнее. Полагаю, что о практической реализации данной схемы контроля речь не идет. Пока это скорее научный казус из области искусственного интеллекта.
- 0 /0
На форуме

Мир энциклопедий

Китайские учёные разработали алгоритм проверки достоверности статей Википедии

Комментарии