A diversidade dialectal do galego terá presenza no ecosistema dixital

  • A plataforma pública Common Voice incorpora unha nova funcionalidade que recolle a fala espontánea, o que permitirá documentar e protexer a riqueza oral da lingua 
  • As contribucións, que ata agora consistían en lecturas en voz alta, rexistrarán variantes léxicas e morfolóxicas, cambios de código ou fenómenos propios da oralidade que adoitan desaparecer na fala lida
  • O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego


Santiago de Compostela, a 21 de xullo 2025.-  O galego e a súa diversidade dialectal dan un novo paso para garantir a súa presenza no ecosistema dixital do futuro, ademais de documentar e protexer a súa riqueza oral. A plataforma colaborativa Common Voice, impulsada por Mozilla e alimentada por persoas voluntarias de todo o mundo, incorpora unha nova funcionalidade para o recoñecemento da fala, nomeada Spontaneous Speech (‘fala espontánea’), que permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, cambios de código ou fenómenos propios da oralidade que adoitan desaparecer na fala lida.

Ata agora, as contribucións nesta plataforma colaborativa (que ten como misión construír recursos abertos para o recoñecemento da fala) consistían en gravacións de lectura en voz alta de textos dispoñibles en dominio público. A nova funcionalidade, que de momento está en fase de probas, abre a porta á recollida dunha fala máis natural, diversa e representativa do uso real da lingua no día a día: a través de preguntas sinxelas rexistradas en Common Voice, as voluntarias poderán gravar respostas breves e espontáneas que recollerán a súa variedade dialectal. 

Esta nova ferramenta, coa que Common Voice reforza o seu compromiso coa diversidade lingüística e coa accesibilidade dixital, facilitará a participación de falantes de distintas idades, rexións ou niveis de alfabetización dixital, ademais de recoñecer e valorizar a fala real, rica en matices e moito máis representativa do uso lingüístico actual que os textos escritos tradicionais.

Como funciona Spontaneous Speech

Dentro da plataforma Common Voice, ao escolleren, na sección Fale, a opción Responda preguntas, as persoas colaboradoras poden gravar as súas respostas; ademais, tamén poden participar transcribindo as respostas doutras usuarias e validando esas transcricións, o que contribúe a crear un corpus de fala de calidade.

O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego. Porén, calquera persoa pode propoñer novas preguntas a través da plataforma, o que garante que os contidos evolucionen de forma aberta e participativa.

As achegas recollidas a través de Spontaneous Speech darán lugar a un conxunto de datos independente, que se publicará baixo licenza CC0, en liña coa filosofía de datos abertos de Common Voice. Isto permitirá que investigadoras, lingüistas, etc. accedan a datos de fala espontánea en lingua galega de forma libre e gratuíta, fomentando deste xeito o desenvolvemento de tecnoloxías inclusivas e plurais, adaptadas ás necesidades reais das persoas usuarias, e a ciencia aberta ou cidadá, coa posibilidade para calquera persoa de participarmos na recolla de datos.


Doazón de voz: AgasallaNós

Baixo o lema AgasallaNós, e co obxectivo de facilitar a participación na recollida de voz en galego dentro da plataforma Common Voice, o Proxecto Nós lembra que está dispoñible a páxina web doagalego.nos.gal, unha vía sinxela e accesible para contribuír ao proxecto. A través desta web, calquera persoa pode doar a súa voz, tanto lendo textos en voz alta como respondendo as novas preguntas de fala espontánea. O obxectivo é recompilar gravacións que representen a diversidade do galego, co fin de contribuír ao desenvolvemento de tecnoloxías de recoñecemento da fala que identifiquen toda a riqueza da nosa lingua. Pódese atopar toda a información no espazo web doagalego.nos.gal.

Proxecto Nós


O Proxecto Nós é unha iniciativa para situar o galego canda as linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial. O seu obxectivo principal é xerar os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados na tecnoloxía da lingua como asistentes de voz, tradutores automáticos ou axentes conversacionais. 

En paralelo, o proxecto promove tamén a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e de recursos de alta calidade e de uso libre. Algunhas delas (un tradutor neuronal multilingüe, un recoñecedor de voz que converte fala en texto escrito, e unha aplicación de síntese de voz que le en galego) xa están á disposición e accesibles a través da web do proxecto para calquera persoa, institución, organización ou empresa que queira desenvolver un produto tecnolóxico, aplicación ou servizo que incorpore a lingua galega. Deste xeito, ademais de garantir os dereitos lingüísticos da comunidade galegofalante no mundo dixital, tamén se contribuirá á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.

O Proxecto Nós é unha iniciativa da Xunta de Galicia, que lle encomendou a súa execución á Universidade de Santiago de Compostela (USC) a través de dúas entidades punteiras de investigación en Intelixencia Artificial e Tecnoloxías da linguaxe: o Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS). Actualmente está sendo financiado polo Ministerio para la Transformación Digital y de la Función Pública con fondos da Unión Europea-NextGenerationEU, no marco do proxecto ILENIA.

PUBLICIDADE ---------------------------------------------------------------------------------------------------