Казахский, кантонский и ток-писин: в Google Translate добавили 110 новых языков
27 Июн 2024, 19:19

Казахский, кантонский и ток-писин: в Google Translate добавили 110 новых языков

В переводчик Google добавили 110 новых языков. К настоящему времени Google Translate поддерживал 133 языка, поэтому это расширение, которое компания называет самым большим за всю историю, знаменует собой значительный скачок.

Языковая модель ИИ PaLM 2 AI от Google помогла переводчику выучить эти новые языки. Она особенно хорошо изучала родственные языки, «близкие к хинди, такие как авадхи и марвади, а также французские креольские языки, такие как сейшельский креольский и маврикийский креольский», — пишет в блоге разработчик Исаак Касуэлл из Google.

«В список новых языков, поддерживаемых Переводчиком, входит кантонский, который уже давно является одним из самых востребованных языков в Google Translate, — говорит Касуэлл. — Поскольку кантонский язык часто пересекается с мандаринским в письменной форме, это затрудняет поиск данных и обучение моделей». Касуэлл также говорит, что «около четверти новых языков происходят из Африки».

На большинстве новых языков говорят по меньшей мере миллион человек, рассказывает Касуэлл в интервью The Verge, в то время как «некоторыми» говорят сотни миллионов человек.

Расскажите друзьям про новость