2024-07-07

Google Translate ek-, aŭ ellernis la romaan lingvon

 

Neniam antaŭe tiom multaj novaj lingvoj fariĝis disponeblaj en la servo Google Translate samtempe. En la lastaj jaroj ŝajnis, ke malmulte ŝanĝiĝis en la ĉiutaga vivo de milionoj da homoj, kiuj uzas Google Translate. Tamen, la evoluiga teamo nun faris signifoplenan salton per aldono de subteno por 110 novaj lingvoj al la aŭtomata traduka servo. La efektivigo de ĉi tiu disvastigo estis forte influita tra la granda lingvomodelo PaLM 2, ellaborita interne de Google. En la plej nova ĝisdatigo, ĝenerale malpli parolataj lingvoj estis aldonitaj al la ofertoj de la servo. Iuj el ĉi tiuj lingvoj estas parolataj nur de kelkaj mil homoj tutmonde, dum aliaj estas konataj de centoj da milionoj. Tamen, 614 milionoj da homoj tutmonde parolas ĉi tiujn lingvojn, reprezentante ĉirkaŭ 8 elcenton de la tutmonda loĝantaro. Inter la lingvoj estas la afara, la ĉeĉena, la kantona, la manĉura, la panĝaba (per la ŝahmuka ortografio), la tamaziĥta, la tokpisino kaj la romaa (la origina lingvo de la ciganoj - romaoj, sintioj, kaleoj, manuŝoj, estas multaj nomoj kiel la ciganoj nomas sin). Guglo ŝajne emfazis la romaan, deklarante ke pritrakti diversajn dialektojn de tiaj lingvoj prezentas grandan defion por la aŭtomata tradukado, kaj ĉi tie estas kie la kapabloj de grandaj lingvomodeloj efektiviĝas.