Э

Мир энциклопедий

encyclopedia.ru

Фонд Викимедиа заключил сделки для обучения ИИ-моделей технологических компаний

Список клиентов пополнили Microsoft, Meta*, Amazon, Perplexity, Mistral AI и другие

  • 18 января 2026
  • выбор редакции
  • просмотров 427
  • комментариев 10
Главная страница корпоративного продукта Wikimedia Enterprise для платной доставки контента ресурсов Фонда Викимедиа (18 января 2026 года)Представитель Фонда Викимедиа (англ. Wikimedia Foundation) — оператора Википедии (англ. Wikipedia) и других проектов — сообщил Reuters [1]1 и прочим СМИ о заключении сделок по обучению искусственного интеллекта (ИИ; англ. artificial intelligence, AI) с несколькими крупными технологическими компаниями, включая Microsoft, Meta2 и Amazon.

Как отмечает Reuters, соглашения стали важным этапом в развитии некоммерческой организации (НКО), так как позволят наконец монетизировать зависимость технологических компаний от контента Свободной энциклопедии.

Источник также сообщил, что в 2025 году были подписаны аналогичные контракты с ИИ-стартапом Perplexity и с французской компанией Mistral AI, а также с другими организациями-партнёрами Meta3 и Amazon.

При этом первые соглашения были заключены ещё в 2022 году — с Alphabet от Google (GOOGL.O) и НКО «Архив Интернета» (АИ; англ. Internet Archive).

Контент Википедии имеет важное значение для языковых моделей — БЯМов4: примерно 65 млн статей на более 300 языках — ключевая часть обучения генеративных чат-ботов и их помощников-плодов труда специалистов по ИИ. В связи с растущими нагрузками ИИ-ботов увеличились расходы на поддержку серверов при том, что основным заявленным финансовым ресурсом для деятельности Викимедии остаются сравнительно небольшие пожертвования от общественности. Вот почему Фонд Викимедиа добивается более широкого внедрения своего корпоративного продукта Wikimedia Enterprise [2]5 — для платной доставки контента Википедии и других подконтрольных ресурсов.

Комментарии дали президент Wikimedia Enterprise — в 2022 году старший директор по доходам Фонда Викимедиа — Лейн Беккер (англ. Lane Becker) и корпоративный вице-президент Microsoft Тим Фрэнк (англ. Tim Frank). Википедия — важнейший элемент для работы технологических компаний, и им необходимо определиться, как ей оказывать финансовую поддержку. Нам потребовалось время, чтобы понять, какой набор функций следует предоставить, если мы собираемся перевести компанию с бесплатной платформы на коммерческую,.. однако все наши крупные технологические партнёры уже считают необходимым взять на себя обязательства по поддержке работы Википедии.
Лейн Беккер, президент Wikimedia Enterprise
Доступ к высококачественной и достоверной информации лежит в основе представлений Microsoft о будущем ИИ... [Совместно с Викимедией] мы помогаем формированию устойчивой экосистемы контента для ИИ-Интернета, в которой ценные участники получают по заслугам.
Тим Фрэнк, корпоративный вице-президент Microsoft
В преддверии заключения соглашений (месяцем ранее) ситуацию прокомментировал сооснователь Википедии Джимми Уэйлс (англ. Jimmy Wales) [3]6. Википедия спонсируется волонтёрами. Люди жертвуют деньги на поддержку Википедии, а не на субсидирование OpenAI, которое обходится нам в кучу денег. Мне кажется, это несправедливо.
Джимми Уэйлс, сооснователь Википедии, председатель Фонда Викимедиа (2003—2006), почётный председатель Фонда Викимедиа (с 2006)
Википедист № 1 добавил, что скорее постарается пристыдить технологические компании, нежели будет подавать на них в суд.

Примечания

  1. Американская транснациональная холдинговая компания Meta Platforms Inc. признана экстремистской и запрещена в Российской Федерации (РФ).
  2. Большая языковая модель (БЯМ; англ. large language model, LLM) — языковая модель на основе нейронной сети со множеством параметров, которая проанализировала большой объём неразмеченного текста с обучением без учителя (без вмешательства экспериментатора).

Литература

  1. Sophia D. [М.] Wikipedia owner signs on Microsoft, Meta in AI content training deals/ Deborah [Mary] Sophia; Editing by Alan Barona. — Текст: электронный// Reuters. — 2026. — 15 января. — URL: https://www.reuters.com/business/retail-consumer/wikipedia-owner-signs-microsoft-meta-ai-content-training-deals-2026-01-15/ (дата обращения: 30.01.2026).
  2. Wikimedia Enterprise — APIs for AI, search & knowledge graphs: [сайт]. — URL: https://enterprise.wikimedia.com/ (дата обращения: 30.01.2026).
  3. Sophia D. M., Hu K. Wikipedia seeks more AI licensing deals similar to Google tie-up, co-founder Wales says/ Deborah Mary Sophia, Krystal Hu. — Текст: электронный + Изображение (двухмерное): электронное// Reuters. — 2025. — 4 декабря. — URL: https://www.reuters.com/business/media-telecom/wikipedia-seeks-more-ai-licensing-deals-similar-google-tie-up-co-founder-wales-2025-12-04/ (дата обращения: 30.01.2026).

Упомянутые персоны, псевдонимы и персонажи


  • Теги
  • AI
  • Amazon
  • chat
  • commercial product
  • customers
  • delivery of content
  • LLM
  • Meta
  • Microsoft
  • Mistral AI
  • monetization
  • Perplexity
  • Wikimedia Enterprise
  • Wikimedia Foundation
  • Wikipedia
  • ИИ
  • Фонд Викимедиа
  • доставка контента
  • коммерческий продукт
  • чат-бот

(Голосов: 2, Рейтинг: 3.35)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Дело правильное: подобные крупные корпорации с многомиллиардными бюджетами вполне могут позволить себе выделить несколько миллионов на поддержку самой популярной сетевой энциклопедии мира. Главное теперь, чтобы это была не разовая акция, а постоянная.
    • 1/0
  • Ссылка на комментарий
    Важно, чтобы коммерческий контур не начал диктовать редакционную политику или приоритеты развития. Но сам факт того, что Википедия не стала просить, а выставила счет за системную зависимость, на мой взгляд, признак зрелости, а не отхода от идеалов.
    • 1/0
  • Ссылка на комментарий
    Лилия Тумина написала:
    Дело правильное: подобные крупные корпорации с многомиллиардными бюджетами вполне могут позволить себе выделить несколько миллионов на поддержку самой популярной сетевой энциклопедии мира. Главное теперь, чтобы это была не разовая акция, а постоянная.
    Тут еще посмотреть надо, кому данная коллаборация будет более выгодной. Для гигантов на самом деле несколько десятков миллионов — вообще не деньги, но они получают огромнейший массив данных от Википедии, на основе которых можно не только обучать ИИ, но и модернизировать системы и модели его поведения.
    • 1/0
  • Ссылка на комментарий
    Я бы хотел видеть, чтобы часть средств целевым образом возвращалась в сообщества малых языков: именно там «65 млн статей на 300 языках» превращаются в реальный вклад, а не в красивую цифру.
    • 0/0
  • Ссылка на комментарий
    Роман Изосимов написал:
    Я бы хотел видеть, чтобы часть средств целевым образом возвращалась в сообщества малых языков: именно там «65 млн статей на 300 языках» превращаются в реальный вклад, а не в красивую цифру.
    Зачем? Чтобы что? Вопрос
    • 0/0
  • Ссылка на комментарий
    lisss написал:
    Зачем? Чтобы что?
    Чтобы данные на этих языках были качественными, а не сгенерированными ботами. Если Фонд Викимедиа продает контент как «высококачественный и достоверный» (как сказано в новости), то нужно инвестировать в людей, которые обеспечивают эту достоверность на местах, а не только в сервера.
    • 0/0
  • Ссылка на комментарий
    Роман Изосимов написал:
    Я бы хотел видеть, чтобы часть средств целевым образом возвращалась в сообщества малых языков: именно там «65 млн статей на 300 языках» превращаются в реальный вклад, а не в красивую цифру.
    А почему вы делаете акцент именно на малых языках? Ведь корпорациям интересен контент сетевой энциклопедии прежде всего на английском языке и других популярных языках мира. Соответственно, вкладываться надо в качество и достоверность статей в первую очередь именно на популярных языках, а не на адыгейском, самоанском, гагаузском и других малых языках. Это всё равно, что если бы городские власти при выборе того, где в первую очередь чистить снег — вокруг одноэтажного барака или вокруг 24-этажки, выбрали барак.
    • 0/0
  • Ссылка на комментарий
    Лилия Тумина написала:
    А почему вы делаете акцент именно на малых языках? Ведь корпорациям интересен контент сетевой энциклопедии прежде всего на английском языке и других популярных языках мира. Соответственно, вкладываться надо в качество и достоверность статей в первую очередь именно на популярных языках, а не на адыгейском, самоанском, гагаузском и других малых языках. Это всё равно, что если бы городские власти при выборе того, где в первую очередь чистить снег — вокруг одноэтажного барака или вокруг 24-этажки, выбрали барак.
    Вы глубоко заблуждаетесь насчет интересов корпораций. Английский язык в сети и так представлен в избытке, на нём ИИ уже обучились прекрасно. Сейчас главная битва техногигантов (той же Meta с их проектом No Language Left Behind) идет как раз за «малые» и «средние» языки, чтобы охватить рынки развивающихся стран. Данные на гагаузском или самоанском для обучения моделей сейчас стоят дороже, потому что они дефицитные (low-resource languages). А «24-этажка» английского языка и так обслуживается тысячами волонтеров бесплатно. Деньги нужны там, где есть риск исчезновения данных, а не там, где и так всё хорошо.
    • 1/0
  • Ссылка на комментарий
    Роман Изосимов написал:
    Если Фонд Викимедиа продает контент как «высококачественный и достоверный» (как сказано в новости),
    Он его не продает. С улыбкой Публикует бесплатно. С улыбкой
    Роман Изосимов написал:
    то нужно инвестировать в людей, которые обеспечивают эту достоверность на местах, а не только в сервера.
    Методику отбора предоставите? Вот, например, в России. Сегодня один депутат предлагает затмить «Диснейленд» и сделать «Чебурляндию». Почему не «Чебурземье», потому как «лэнд» скрепам не соответствует, но это не важно. А вот пару дней назад аж целый глава кафедры МГУ Дугин кричал, что Чебурашка — гибель России. И как отбирать будете? Рацио уже покинуло этот мир. С улыбкой
    Роман Изосимов написал:
    Данные на гагаузском или самоанском для обучения моделей сейчас стоят дороже, потому что они дефицитные (low-resource languages).
    Данные за блок знаний вы забыли упомянуть. Ну да, в испанском блок стоит условно 10 млрд за 100 млн символов, а в гагаузском 100 тысяч за сто тысяч. Дороже. Но и емкость рынка никакая. И идут на отработку копейки. Но в униках звучит «дорого».
    • 1/0
  • Ссылка на комментарий
    Я не сторонница теорий заговора, но что-то мне подсказывает, что Фонд Викимедиа существовал и существует не за счет донатов простых граждан, а «пожертвования» от компаний «Гугл» или «Майкрософт» — лишь попытка скрыть правду о реальных инвесторах и владельцах, которые однозначно имеют отношение к большой пятерке венчурных фондов США, крупнейшим банкам США, а также к военным. Сделан сей официоз лишь для того, чтобы люди верили в неподкупность и непредвзятость компании, иначе Вики и всё, что с ней связано, со временем перестанут быть кристально чистыми продуктами в глазах потребителя, что в свою очередь создаст плодородную почву для появления чего-то более независимого, работающего на блокчейне, и частичный отказ от доступной и «независимой» информации.
    • 0/0