Э

Мир энциклопедий

encyclopedia.ru

Роботов призывают спасать Википедию от «дедовщины»

  • 11 ноября 2013
  • просмотров 10050
  • комментариев 1
Есть интересное определение «интернета вещей» как места, где цифровой мир встречается с миром интеллектуальным. А со времён самой первой Промышленной революции, Industry 1.0, символом интеллектуального мира является энциклопедия: толковый словарь наук, искусств и ремёсел появился аккурат в век самых первых паровых машин и угольных шахт, век Просвещения. Ну а одним из явлений, которым будут характеризовать наше время, явно является Википедия (Wikipedia), попытка создать сумму знаний на базе цифровых технологий и добровольного труда. И вот сейчас говорят о возможности того, что редактировать Википедию станут роботы!

Энциклопедии бумажные, тяжёлые тома, рассказывавшие обо всём, от лифляндской реки Аа до реки Яя в Кемеровской области, если и не забыты окончательно, то сохраняются лишь в домах немногих любителей старины, а открываются вообще единицами. Свод знаний ныне хранится в Интернете, и чаще всего им оказывается Википедия. Это шестой по посещаемости сайт мира. На него с очень высокой вероятностью приведёт поиск в солидном и основательном Google, к нему прибежит говорунья Siri, заставляющая вспомнить персонажа из саги о Гиперионе Дэна Симмонса...

Действительно, Википедия — явление уникальное. Появившись на свет 15 января 2001 года английской версией, она через пару лет имела уже сотню тысяч статей, а на 8 ноября 2013-го в ней на наречии англосаксов насчитывалось 4 370 629 статей, просматриваемых десять миллиардов раз в месяц, причем уже к 2011 году эти статьи претерпели полмиллиарда правок... Encyclopædia Britannica Online, наследница авторитетнейших бумажных изданий, с её 120 000 регулярно обновляемых статей, выглядит бедной Золушкой на этом фоне... Но, как давным-давно сказано, наши достоинства есть продолжение наших недостатков.

Проблемы — причём очень серьёзные — не миновали и Википедию. Говорят ни более ни менее как об «упадке Википедии» («The Decline of Wikipedia»). Отмечаются проблемы, подрывающие её фундамент, ставящие под сомнение её способность составить свод всех человеческих знаний. И проблемы эти порождает отток тех самых добровольцев, которые должны защищать ресурс, построенный на общедоступном Wiki-движке, от умышленных манипуляцией информацией в корыстных или политических целях, бескорыстных мистификаций и примитивного вандализма.

В результате многочисленные статью Википедии оказываются крайне неоднородными по содержанию. О таком явлении, как «покемоны», или о барышнях и дамах, снимавшихся в кино «для взрослых», узнать можно почти всё, а вот о географии Африки южнее Сахеля — прискорбно мало... Ну а качественные статьи, которые, по мнению коллектива Википедии, составляют её ядро (если возьмёте том старой энциклопедии, то увидите перечень важнейших статей с указанием их авторов), тонут в груде «информационного шума». Тысяча лучших материалов не заслужила — по критериям самой Википедии — даже среднего уровня оценок...

И никаких секретных причин такого состояния дел нет. Те добровольцы, авторы и редакторы, которые приходят в проект, сталкиваются с многоуровневой бюрократией, отпугивающей новичков, сокрушающей энтузиазм и истирающей добрые намерения. Если говорить о Википедии в терминах кибернетики, то можно использовать понятие не-марковской системы, поведение которой в значительной степени определено её историей, былыми этапами эволюции.

Началось все с максимальной свободы. Потом появились случаи явной «туфты», прямого вандализма, увлекательные, но малоперспективные политические дискуссии атеистов и новообращённых верующих, ольстерских католиков и протестантов — прямая порча информации. Потребовалось введение защитных фильтров... Ими стали редакторы. Ну а говоря в терминах элементарной, линейной ещё, теории автоматического регулирования, пытаясь повысить устойчивость системы, мы платим за это коэффициентом передачи по контуру, точностью и динамикой... Нечто похожее происходит и здесь, с Википедией.

Бюрократическая иерархия Википедии

Эта бюрократическая схема отображает работу редакции Википедии
Проще говоря, здесь сложилась элементарная «дедовщина». Неформальная власть «старых» редакторов над новичками. И если «дедовщина» обычная кончается в тот момент, когда офицеры начинают дневать и ночевать в роте/на батарее, то с Wikipedia такой номер не пройдёт: устав для добровольцев не писан, дисциплинарных прав в отношении них у 187 сотрудников Фонда Викимедиа (Wikimedia Foundation), некоммерческой организации, оплачивающей ресурсную поддержку Вики, нет и быть не может. Но проблему они осознают со всей серьёзностью. И говорят об ответственности перед обществом (тем самым, что охотно собирает пожертвования для энциклопедии), лежащей на них...

Дело в том, что Википедия фактически уникальна. Ссылки на неё топят в поиске Google все прочие варианты ответа. Проект Encarta был закрыт Microsoft ещё в 2009 году: компания добровольцев-энтузиастов фактически поборола гиганта мира традиционных персональных компьютеров. Упомянутая выше Encyclopædia Britannica Online жаждет получить за годовую подписку на свои 120 000 статей 70 долларов — в отличие от предоставляемых читателю бесплатно 4 370 629 статей Вики... Так что деваться некуда: единственный путь — повышать качество самой Википедии...

И глава Фонда Викимедиа Сью Гарднер (Sue Gardner), и основатель Википедии Джимми Уэйлс (Jimmy Wales) считают, что этому поможет вовлечение в проект новых участников. Они оперируют конкретными цифрами: в 2007 году над «народной энциклопедией» трудились 51 тысяча редакторов. К лету 2013 года их число сократилось до 31 тысячи человек. Однако материалов-то становится всё больше, а потребность в них растёт всё быстрей. Но новичков — как пишут американские журналисты — отпугивает всевластие небольшой группы из 635 человек, имеющих статус «администраторов» английской версии Вики: именно им принадлежит реальная власть над проектом...

Как же эта «бюрократия добровольцев» справляется с «властью» над проектом уникальных размеров и сложности? Подробно исследовавший — по контракту с Фондом Викимедиа — эту проблему аспирант Миннесотского университета Аарон Халфейкер (Aaron Halfaker) описал результаты в материале «Подъём и упадок сообщества открытого сотрудничества» («The Rise and Decline of an Open Collaboration Community: How Wikipedia's reaction to sudden popularity is causing its decline»). Оказывается, власть бюрократов-энциклопедистов основывается на различных программных инструментах редактирования, позволяющих «активным редакторам» и «администраторам» буквально одним движением мыша править и отвергать работы новичков.

Статистика использования алгоритмических средств для отклонения изменений новых зарегистрированных пользователей Википедии (Аарон Халфейкер)

Власть бюрократов-энциклопедистов основывается на использовании программных инструментов
То есть фактически нынешняя, образца 2013 года, Википедия сформирована работой полуавтоматических инструментов. Редакторов-полуавтоматов, так, что ли, сказать... Именно благодаря им она достигла такого объёма, и они же виновны в проблемах с качеством. Автор-доброволец может писать что угодно. Но приняты или отброшены текст или правка будут по предельно формализованной процедуре. И вот теперь появилась идея — решить назревшие в Википедии проблемы с помощью ещё более широкого привлечения роботов-редакторов. Её излагают в «Assessing the Quality of Wikipedia Pages Using Edit Longevity and Contributor Centrality» авторы из Университетского колледжа Дублина Сянюй Цинь (Xiangju Qin) и Патрик Каннингэм (Pádraig Cunningham).

Распределение материалов Википедии по качеству и достоверности (Сянюй Цинь и Падрег Каннигем)

Цветные кружочки показывают распределение материалов Википедии по качеству и достоверности; выборка более чем по 200 языкам
Нет, они не предлагают железного человека с кремниевым мозгом, правящего статьи Вики. Речь идёт лишь о применении подробно описанных в статье алгоритмов, которые смогут наглядно оценивать качество статей сетевой энциклопедии. Причём на основе внимания, которое им уделяют читатели. На основе тех правок, которые читатели порываются внести. Одним из критерием достоверности статьи или правки тут оказывается долговечность. Если статья живёт долго и читается — она хороша. Если правки не вызывают желания их немедленно откорректировать, то они адекватны и объективны. (Материалы, порождающие политические флеймы, — отдельный разговор...)

Так что подобный инструмент может дать объективный критерий оценки качества материалов и правок в Википедии. Американские журналисты полагают, что это в некоторой степени сможет решить описанную проблему с качеством статей, с организацией работы коллектива добровольцев. «Робот-редактор» как коллективный агитатор и организатор... В удивительное время живём, уважаемые читатели. Самый массовый свод знаний уже редактируется полуавтоматами, а в ближайшем будущем всё больше и больше станет склоняться к «чистой» автоматике.
  • Теги
  • en.wikipedia.org
  • Wikipedia
  • Википедия
  • английская Википедия
  • английский язык
  • бюрократия
  • википедисты
  • дедовщина
  • оценка качества статей
  • оценка статей
  • редактирование статей

(Голосов: 2, Рейтинг: 3.44)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Классическая ситуация со сторожами, сторожащими сторожей. Чем больше ботов, тем больше вероятность "машинно-логической" ошибки. За таким ПО, значится, должны надзирать люди. А чем больше людей, тем больше вероятность уже человеческого фактора, за которым должны следить боты, за которыми...

    В статье "многабукаф"  о проблемах Википедии. Не умаляя труд уважаемого автора  статьи, хочется заметить, что проблема Вики "номер раз" много проще и вовсе не энциклопедическая. Все дело в логическом противоречии:

    1) Википедия — свободная энциклопедия. В нее могут писать не специалисты а все, кто хочет и о чем хочет.

    2) Википедия — неэнциклопедична в силу:

    а) Недостоверности.
    б) Предвзятости.
    в) Обычного хулиганства.
    г) Обилия дилетантов, которые пишут о совершенно незнакомых им вещах и понятиях.

    3) Поэтому необходим механизм проверки качества статей и достоверности контента. С обязательной классификацией авторов на профи и дилетантов. Т.е. — прямое противоречие с п.1.

    А по поводу иерархии — полностью согласен с автором — любое неформальное объединение гражданских при отсутствии четких изначально определенных регламентирующих документов и контролирующих органов (например, строевой устав и военная прокуратура  Широкая улыбка  Шутливо немедленно обрастает своей негласной иерархией (см. психологию малых групп).  

    Если проще — иерархия авторов Википедии ничем не отличается от аналогичных "дедовщинских" структур в любой, к примеру, онлайн-игре. Что опять-таки к энциклопедиям не имеет отношения.

    Резюме:

    Основная проблема Википедии — "Как создать энциклопедию при помощи слабо организованных дилетантов, не уступающую по качеству энциклопедиям, созданным  организованными коллективами профессионалов?"
    • 1/0