Э

Мир энциклопедий

encyclopedia.ru

Микрософт создала переводчик для наполнения языковых версий Википедии

  • 20 октября 2010
  • просмотров 16414
  • комментариев 4

Microsoft Research, исследовательское подразделение Микрософт (Microsoft), сообщило о выпуске программы WikiBhasha для пополнения языковых версий Википедии новыми статьями и текстами за счет машинного перевода из английской Википедии (Wikipedia), сообщается в  пресс-релизе Microsoft и блоге Фонда Викимедиа (Wikimedia Foundation).

Англоязычная версия Вики неслучайно было выбрана как источник, так как содержит максимальное количество статей (около 3,5 млн. статей). Новый инструмент будет поддерживать создание нового контента на более чем 30 языках мира. Показательно, что название программы WikiBhasha образовано от слова «bhasha», означающего «язык» на хинди и санскрите.

Стоит отметить, что при добавлении новых статей при помощи WikiBhasha пользователю необязательно изучать вики-разметку (в большинстве случаев это не требуется).

«Бета-версия WikiBhasha позволяет легко создавать контент на множестве языков, создавая большое количество параллельных данных на разных языках для исследователей, которые занимаются разработками в области машинного перевода. С участием сообществ пользователей Википедии можно существенно увеличить объемы качественного контента на разных языках», — сказал П. Анандан (P. Anandan), управляющий директор Microsoft Research India.

«Мы всегда рады видеть работу по улучшению сотрудничества между разделами Википедии на разных языках. Microsoft Research проделала в рамках WikiBhasha очень хорошую работу. Также мы рады, что компания открыла исходный код этого инструмента», — отметил Дениз Купер (Danese Cooper), технический директор Фонда Викимедиа.

После выхода пресс-релиза Microsoft в ИТ-блогах было высказано предположение, что посредством WikiBhasha корпорация Microsoft будет тестировать свои технологии машинного перевода, сообщает CNews.

WikiBhasha — проект с открытым исходным кодом, выпущенным под лицензией Apache License 2.0. Бета-версия WikiBhasha доступна всем желающим на сайте Фонда Викимедиа или по адресу wikibhasha.org. Приложение работает на платформе Windows Azure.

Программу можно инсталлировать в браузеры Internet Explorer (7.0 и 8.0) в операционных системах Windows XP, Vista и Windows 7, а также в Firefox (3.5 и выше) на Linux Fedora (11 и 12), Windows XP, Vista и Windows 7. Так, редакции CNews удалось запустить WikiBhasha на Firefox под Linux Ubuntu и Mac OS X.

Видеопрезентация WikiBhasha (английский язык)
Рассказывает
Айшвария (Aishwarya), специалист Microsoft Research India

В будущем Фонд Викимедиа и исследовательское подразделение Microsoft планируют тесно сотрудничать с сообществом Википедии прежде всего для создания контента для арабского, немецкого, японского, португальского, испанского и хинди разделов энциклопедии.

  • Теги
  • Danese Cooper
  • en.wikipedia.org
  • English
  • machine translation
  • Microsoft
  • Microsoft Research
  • P. Anandan
  • WikiBhasha
  • Wikimedia Foundation
  • Wikipedia
  • Википедия
  • Дениз Купер
  • Микрософт
  • П. Анандан
  • Фонд Викимедиа
  • английская Википедия
  • машинный перевод

(Голосов: 4, Рейтинг: 3.66)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    С одной стороны, такой переводчик, естественно, полезен: ведь сетевая энциклопедия, точнее ее малоразвитые языковые версии, быстрее станет наполняться статьями. А чем больше хороших статей, тем полнее и лучше энциклопедия! Но, с другой стороны, перевод-то машинный, поэтому возможны ситуации, когда некоторые многозначные слова система будет переводить неточно, и в результате мы получим не хорошую энциклопедическую статью, а набор фраз, плохо связанных друг с другом. Хотя, в любом случае, дождаться первых переводов и лишь потом делать выводы.
    • 0/0
  • Ссылка на комментарий
    Иван Некайский пишет:
    Но, с другой стороны, перевод-то машинный, поэтому возможны ситуации, когда некоторые многозначные слова система будет переводить неточно, и в результате мы получим не хорошую энциклопедическую статью, а набор фраз, плохо связанных друг с другом. Хотя, в любом случае, дождаться первых переводов и лишь потом делать выводы.

    Да, согласна. Автопереводчик "выполняет" свою работу исключительно в соответствии с грамматическими правилами соответствующих языков. И может являться лишь каким-то оперативным вспомогательным средством для создания уникальных переводных текстов уже людьми, мало-мальски знакомыми с языком оригинала. Идея
    • 0/0
  • Ссылка на комментарий
    Машинный перевод? Если честно, то ни разу не видел корректного перевода, который был сделан при помощи машины. Ни у Промта, ни у Гугла да и вообще ни у кого. Словосочетание — это прежде всего смысловой подтекст, который пока недоступен машине, и мне думается, что во многих статьях будет такая ахинея, которая девальвирует ценность статьи и как следствие и ценность самого ресурса, в частности, Вики на языке перевода.
    • 0/0
  • Ссылка на комментарий
    После выхода пресс-релиза Microsoft в ИТ-блогах было высказано предположение, что посредством WikiBhasha корпорация Microsoft будет тестировать свои технологии машинного перевода, сообщает CNews.


    Вот это вполне похоже на правду. Где же как не в Вики, где расположены миллионы статей по различным тематикам, тестировать и улучшать машинный перевод! Шутливо  Самое главное, что статьи написаны без подтекста (второго смысла), то есть несут в себе лишь смысловую нагрузку БЕЗ ЭМОЦИЙ... А для машинного переводчика это как раз то, что Microsoft прописал...
    Возможно, в будущем переводчик с чувством переведет на хинди и "Унылая пора, очей очарованье...", а пока пусть "тренируется" на Вики.
    • 0/0