Э

Мир энциклопедий

encyclopedia.ru

Искусственный интеллект поможет Википедии найти некачественные статьи и правки

Искусственный интеллект поможет Википедии найти некачественные статьи и правки
  • 1 декабря 2015
  • просмотров 2397
  • комментариев 7
В Википедии (Wikipedia) появился встроенный сервис по поиску требующих доработки новых статей и некачественных правок, основанный на принципах искусственного интеллекта, сообщается в блоге Фонда Викимедиа (Wikimedia Foundation).

Сервис объективной оценки исправлений (Objective Revision Evaluation Service, ORES) использует машинное обучение. Сначала новые правки помечают как добросовестные (goodfaith), недобросовестные (wp10), вредные (damaging) или требующие отмены (reverted) википедисты со специальными правами. Затем постепенно программа должна сама научиться отличать зёрна от плевел (алгоритм не раскрывается).

Викимедиа привела пример с двумя правками, оценку которым поставил ORES. В первом случае бессмысленное предложение был признано вредным с вероятностью 91,63%. Во втором корректная ссылка была оценена как не вредная с вероятностью 86,83%.

По состоянию на 31 января 2015 года, в англоязычной Вики было более 4,6 миллионов статей, из которых оценку около 33 тысяч имели качество выше уровня «хорошая статья». Эти данные и использовали для первоначального машинного обучения алгоритма, отмечает TJournal.

Стоит отметить, что ORES может использоваться через интерфейс программирования приложений (API) как автоматизированно, так и вручную — по ссылке формата:

http://ores.wmflabs.org/scores/enwiki/?models=reverted|wp10&revids=34854345

где:
  • models — список типов проверок, перечисленных через разделитель «|» (goodfaith, wp10, damaging, reverted).
  • revids — идентификатор конкретной правки в истории редактирования статьи.
На проверку уходит около 100 миллисекунд, а на отображение выполненных расчётов в формате JSON — около 50 миллисекунд.

На момент официального запуска ORES поддерживал 14 языковых разделов Свободной энциклопедии, среди которых нет русскоязычного, но присутствуют украинский, английский, немецкий, французский, испанский, итальянский, португальский, нидерландский, эстонский, турецкий, фарси, иврит, индонезийский и вьетнамский.

В любом случае критика новации появилась и со стороны представителей русской Википедии. Так, википедист Андрей Ситник высказал предположение, что ORES не искусственный интеллект, а «экспертная система».

Также стоит напомнить, что ORES — не первый подобный инструмент. Ранее были созданы Huggle, STiki и ClueBot NG, однако их поддержка и разработка были давно приостановлены.

Упомянутые персоны, псевдонимы и персонажи


  • Теги
  • AI
  • artificial intelligence
  • edits
  • new articles
  • ORES
  • web service
  • Wikimedia Foundation
  • Wikipedia
  • Википедия
  • Фонд Викимедиа
  • веб-сервис
  • искусственный интеллект
  • новые статьи
  • оценка правок
  • оценка статей
  • правки
  • экспертная система

(Голосов: 2, Рейтинг: 3.44)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Всё равно я не допонимаю, КАК может определить машина, насколько полноценна информация в Вики-статье:
    Затем постепенно программа должна сама научиться отличать зёрна от плевел (алгоритм не раскрывается).
    Вопрос
    Посредством анализа и синтеза информации из оцифрованных авторитетных справочников, что ли? Ну допустим, даты рождения/смерти и прочие абсолютные биографические данные машина еще поправит, равно как и сведения о давнопрошедших событиях. А что-то более новое, не имеющееся пока ни в БРЭ (по причине затянутости ее выпуска  Печально  Шутливо, ни тем более — в БСЭ, ни в специализированных интернет-справочниках?  Вопрос
    • 0/0
  • Ссылка на комментарий
    YA_HELEN пишет:
    Всё равно я не допонимаю, КАК может определить машина, насколько полноценна информация в Вики-статье:
    Затем постепенно программа должна сама научиться отличать зёрна от плевел (алгоритм не раскрывается).

    Посредством анализа и синтеза информации из оцифрованных авторитетных справочников, что ли? Ну допустим, даты рождения/смерти и прочие абсолютные биографические данные машина еще поправит, равно как и сведения о давнопрошедших событиях. А что-то более новое, не имеющееся пока ни в БРЭ (по причине затянутости ее выпуска ), ни тем более — в БСЭ, ни в специализированных интернет-справочниках?
    Естественно, это очень спорно, насколько подобная программа сможет выполнять оценку качества статей и правок. Но, наверное, она всё-таки необходима, раз её разработали и внедряют.
    • 0/0
  • Ссылка на комментарий
    Взгляды ретрограда мне никогда не были свойственны. Но всему есть предел! Неужели теперь искусственный интеллект станет определяющим в выборе статей, достойных украшать собой электронную энциклопедию? По-моему, с таким техническим прогрессом мы скоро докатимся, что называется, до ручки.  Скептически
    • 0/0
  • Ссылка на комментарий
    Глупость абсолютная! Особенно позабавила формулировка "бессмысленное предложение". Тут натуральный-то интеллект порой не в силах определиться по поводу ценности той или иной фразы, потому что кроме чисто информативной стороны есть ещё и "борода" из личного опыта читателя, с свете которой одна и та же информация преломляется: от бессмысленной до бесценной.
    Ну что ж, энциклопедия избрала неверный путь и роет могилу себе сама.  
    • 0/0
  • Ссылка на комментарий
    Как-то сама идея о том, что статьи энциклопедии будет проверять некий "железный цензор", не нравится, даже если речь идет о Википедии.
    • 0/0
  • Ссылка на комментарий
    У меня образование гуманитарное, поэтому слабо представляю технические принципы работы этого сервиса. Но если он реально пойдет на пользу сетевой энциклопедии, я только за! Просто редакторы даже при максимальной загруженности не в состоянии самостоятельно отследить всех "тараканов" в тысячах статей.
    • 0/0
  • Ссылка на комментарий
    Такой сервис может быть полезен в правке достоверной информации. В остальных случаях не представляю себе, как машина способна отделить "зерна от плевел". При таком безразборном подходе Википедия может только пострадать.
    • 0/0