Э

Мир энциклопедий

encyclopedia.ru

Google призывает помочь переводу Википедии на малораспространенные языки

  • 15 июля 2010
  • просмотров 9501
  • комментариев 3

Компания Google призвала пользователей перепроверить автоматический перевод Википедии (Wikipedia) на малораспространенные языки, сообщается в официальном блоге компании.

Переводом Википедии Google занимается с 2008 года. Тогда за три месяца на хинди было переведено 600 тысяч слов из более 100 англоязычных статей, что составило примерно 20% всего раздела Википедии на хинди (hi.wikipedia.org).

Для перевода выбирались англоязычные материалы, к которым чаще всего обращались жители Индии. С помощью сервиса Google Trends были выбраны статьи с стабильно высокой посещаемостью. Затем осуществлялся машинный перевод с помощью инструмента Translator Toolkit. Результат редактировался вручную добровольцами-переводчиками.

Стоит отметить, что объем раздела как правило определяется числом статей, однако при машинном переводе его значительную часть занимают заглушки (stubs), которые при помощи волонтеров Google надеется превратить в полноценные вики-статьи.

Количество полноценных статей в разных языковых версиях Википедии (Английский язык = 1)
Количество полноценных статей в разных языковых версиях Википедии (Английский язык = 1)

Судя по графику, неудивительно, что более 16 млн слов планируется перевести именно на арабский, гуджарати, хинди, каннада, суахили, тамильский и телугу.

Результаты деятельности Google и волонтёров были предоставлены 10 июля на партнёрской конференции Wikimania 2010 в Гданьске (Польша).

  • Теги
  • Google
  • Google Trends
  • presentation
  • smaller languages
  • translation
  • Translator Toolkit
  • volunteers
  • Wikimania 2010
  • Wikipedia
  • Википедия
  • волонтёры
  • малораспространенные языки
  • перевод
  • презентация

(Голосов: 1, Рейтинг: 3.3)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Дело-то, конечно, хорошее...

    Однако если переводить, то ВСЁ ПОДРЯД, а не избирательно, Со злостью как, например, тут указано про перевод на язык хинди.
    Просто какой тогда смысл ориентироваться на статистику обращаемости жителей Индии к англоязычным статьям, если они и так ее уже так или иначе перевели/прочитали. А остальное? Вопрос Печально
    • 0/0
  • Ссылка на комментарий
    YA_HELEN пишет:
    Просто какой тогда смысл ориентироваться на статистику обращаемости жителей Индии к англоязычным статьям, если они и так ее уже так или иначе перевели/прочитали.

    Статистика обращаемости отражает степень интереса к статье (теме), но вовсе не гарантирует, что ее прочитали все, полностью и правильно.
    • 0/0
  • Ссылка на комментарий
    Не очень понимаю смысл этой инициативы. Поддержание малых языков? Вопрос Ну так простите, спрос рождает предложение. Был бы спрос на статьи на языке хинди, то и статей было бы намного больше. А это искусственное поддержание ни к какому эффекту не приведет. Скептически
    • 0/0