Diari La Veu del País Valencià
El català és la segona llengua amb més minuts enregistrats a Common Voice

Segons informa Plataforma per la Llengua, el català va superar dimarts les 3.000 hores de talls de veu enregistrades al repositori digital de Common Voice, i ja es troba a només 200 hores de substituir l’anglès com la llengua amb més hores gravades en aquest projecte impulsat per Mozilla Foundation. El català ja era la segona llengua amb més hores enregistrades des de fa uns mesos i aquest mes també ha superat el ruandès com a segona llengua amb més hores validades. Plataforma per la Llengua celebra l’efemèride i s’implicarà a partir d’ara en la recollida de veus per tal de facilitar que les empreses puguen incorporar el català com a llengua de reconeixement i reproducció de veus en els electrodomèstics i en altres objectes d’ús quotidià amb intel·ligència artificial.

Common Voice és un projecte digital que vol forjar un repositori de talls de veu de totes les llengües del món a partir de la col·laboració voluntària de persones que facen la seua aportació de veu o validen l’enregistrament d’altres persones. Aquesta base de dades lliure està segmentada per gènere, edat i variant dialectal, i permet descarregar les veus a qui vulga desenvolupar i millorar programaris de reconeixement de parla, com ara robots domèstics o assistents de veu. La descàrrega d’aquestes veus es pot fer de manera gratuïta i en llicència CC0, l’oferiment al domini públic sense drets d’explotació. Common Voice, que ja compta amb 136 llengües, va ser creat l’any 2017 per Mozilla Foundation i ha estat impulsat als territoris de parla catalana per Softcatalà. Posteriorment, el 2020, es va integrar com a eix de treball del projecte Aina, una iniciativa de la Generalitat de Catalunya i el Barcelona Supercomputing Center, amb la col·laboració del Govern de les Illes Balears, que el va fer créixer de manera significativa.

Amb l’objectiu de fer créixer encara més el català a Common Voice, Plataforma per la Llengua impulsarà una campanya per aconseguir moltes més donacions de veu i fer que, a curt termini, el català assolisca la primera posició en la classificació de llengües amb més hores enregistrades. Per tal d’aconseguir prou representació d’aquells dialectes, gèneres i grups d’edat infrarepresentats fins ara a la base de dades, la campanya combinarà una forta activitat digital amb actes presencials de recollida de veu que facilitaran que aquelles persones més allunyades del món digital també hi puguen participar. Això permetrà, per exemple, augmentar el percentatge de veus de gent gran a la base de dades.

Els detalls de la campanya es faran públics prompte, però Plataforma per la Llengua anuncia que arrencarà el divendres 14 d’abril al Palau Blaugrana, en el marc del partit de l’Eurolliga de bàsquet entre el Barça i el València, i que continuarà amb un segon gran acte durant el partit de lliga entre el Barça i el Reial Madrid. Per al primer partit, l’entitat disposarà d’algunes entrades amb descompte per als seus socis.

Comparteix

Icona de pantalla completa