- 1 декабря 2015
- просмотров 2473
В Википедии (Wikipedia) появился встроенный сервис по поиску требующих доработки новых статей и некачественных правок, основанный на принципах искусственного интеллекта,
сообщается в блоге Фонда Викимедиа (Wikimedia Foundation).
Сервис объективной оценки исправлений (Objective Revision Evaluation Service, ORES) использует машинное обучение. Сначала новые правки помечают как добросовестные (goodfaith), недобросовестные (wp10), вредные (damaging) или требующие отмены (reverted) википедисты со специальными правами. Затем постепенно программа должна сама научиться отличать зёрна от плевел (алгоритм не раскрывается).
Викимедиа привела пример с двумя правками, оценку которым поставил ORES. В первом случае бессмысленное предложение был признано вредным с вероятностью
91,63%. Во втором корректная ссылка была оценена как не вредная с вероятностью
86,83%.
По
состоянию на 31 января 2015 года, в англоязычной Вики было более 4,6 миллионов статей, из которых оценку около
33 тысяч имели качество выше уровня «хорошая статья». Эти данные и использовали для первоначального машинного обучения алгоритма,
отмечает TJournal.
Стоит отметить, что ORES может использоваться через интерфейс программирования приложений (API) как автоматизированно, так и вручную — по ссылке формата:
http://ores.wmflabs.org/scores/enwiki/?models=reverted|wp10&revids=34854345 где:
- models — список типов проверок, перечисленных через разделитель «|» (goodfaith, wp10, damaging, reverted).
- revids — идентификатор конкретной правки в истории редактирования статьи.
На проверку уходит около
100 миллисекунд, а на отображение выполненных расчётов в формате JSON — около
50 миллисекунд.
На момент официального запуска ORES поддерживал
14 языковых разделов Свободной энциклопедии, среди которых нет
русскоязычного, но присутствуют
украинский,
английский,
немецкий,
французский,
испанский,
итальянский,
португальский,
нидерландский,
эстонский,
турецкий,
фарси,
иврит,
индонезийский и
вьетнамский.
В любом случае критика новации появилась и со стороны представителей русской Википедии. Так, википедист
Андрей Ситник высказал предположение, что ORES не искусственный интеллект, а «экспертная система».
Также стоит напомнить, что ORES — не первый подобный инструмент. Ранее были созданы
Huggle,
STiki и
ClueBot NG, однако их поддержка и разработка были давно приостановлены.
Упомянутые персоны, псевдонимы и персонажи