Google Translate sekarang dapat menerjemahkan 110 bahasa baru, ada bahasa daerah dari Indonesia

Google Translate sekarang dapat menerjemahkan 110 bahasa baru, ada bahasa daerah dari Indonesia

Techno.id - Google Translate membuat lompatan terbesar ke depan dengan menambahkan dukungan untuk 110 bahasa baru. Bahasa-bahasa ini didukung model bahasa besar PaLM 2 Google yang melakukan semua pekerjaan latar belakang, mempelajari bahasa yang terkait erat dan menerjemahkan teks dari satu bahasa ke bahasa lain.

Bahasa-bahasa baru termasuk yang dituturkan komunitas kecil penduduk asli serta nama-nama popular seperti Kanton. Ada bahasa yang dihidupkan kembali secara aktif seperti Manx yang hampir punah ketika penutur asli terakhirnya meninggal pada tahun 1974.

Google menjelaskan dalam sebuah posting blog bahwa butuh begitu banyak waktu untuk mendapatkan bahasa Kanton onboard karena kesamaannya dengan bahasa Mandarin, sehingga sulit untuk menemukan data dan melatih model.

Penambahan terbaru adalah bagian dari inisiatif 1.000 Bahasa, di mana Google ingin membangun model AI yang mendukung 1.000 bahasa yang paling banyak digunakan di seluruh dunia. Google sebelumnya menggunakan teknologi yang disebut Zero-Shot Machine Translation untuk mendukung 24 bahasa baru pada tahun 2022.

Google Translate sekarang dapat menerjemahkan 110 bahasa baru, ada bahasa daerah dari Indonesia foto: techno.id/yani andriyansyah

Nah 110 bahasa baru ini mewakili lebih dari 614 juta penutur di seluruh dunia dan menawarkan terjemahan untuk sekitar 8% populasi dunia. Nah yang menarik, dari 110 bahasa baru tersebut terdapat beberapa bahasa daerah dari Indonesia di antaranya Aceh, Bali, Banjar, Batak Karo, Batak Simalungun, Batak Toba, Betawi, Iban (sub suku Dayak), Madura, Makassar, dan Minang.

Raksasa pencarian ini menjelaskan bahwa bahasa dapat memiliki banyak keragaman dalam bentuk varietas daerah, dialek, dan standar ejaan yang berbeda. Memilih variasi bahasa adalah tugas tersendiri, dan Google memilih salah satu yang paling umum digunakan.

Misalnya, Romani adalah bahasa yang memiliki banyak dialek di seluruh Eropa. Model ini menghasilkan teks yang paling dekat dengan Southern Vlax Romani, varietas yang umum digunakan secara online. Tapi itu juga bercampur dalam unsur-unsur dari yang lain, seperti Vlax Utara dan Balkan Romani. Bahasa baru ini akan mulai muncul selama beberapa hari ke depan di situs web Google Translate dan aplikasinya untuk Android dan iOS.

(brl/red)