Italiano e lingue europee a rischio di estinzione digitale
Due terzi degli idiomi dell’Ue potrebbero scomparire dalla rete, dove domina l’inglese. Lo rivela un’indagine dell’Ilc-Cnr nell’ambito della ricerca Meta-Net a cui hanno lavorato più di 200 esperti
L’italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete è tutt’altro che marginale. A dirlo è il rapporto ‘La lingua italiana nell’era digitale’ dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti. “La percentuale di pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005”, spiega Nicoletta Calzolari dell’Ilc-Cnr. “È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese”. Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010. Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. “Il dato è preoccupante”, prosegue Claudia Soria dell’Ilc-Cnr, “perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua”. Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net: “21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale ‘debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)”, spiega Soria. “L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con ‘supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con ‘supporto modesto’. Nessuna lingua, però, ottiene ‘supporto eccellente’”.
“Sono risultati allarmanti”, conclude Hans Uszkoreit, coordinatore di Meta-Net. “La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro”.
Due terzi degli idiomi dell’Ue potrebbero scomparire dalla rete, dove domina l’inglese. Lo rivela un’indagine dell’Ilc-Cnr nell’ambito della ricerca Meta-Net a cui hanno lavorato più di 200 esperti
L’italiano, come la maggioranza delle lingue europee, rischia di scomparire da Internet, anche se la sua presenza in rete è tutt’altro che marginale. A dirlo è il rapporto ‘La lingua italiana nell’era digitale’ dell’Istituto di linguistica computazionale del Consiglio nazionale delle ricerche di Pisa (Ilc-Cnr), parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti. “La percentuale di pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005”, spiega Nicoletta Calzolari dell’Ilc-Cnr. “È stato stimato che nel 2004 in tutto il mondo ci fossero 30,4 milioni di parlanti italiani online. Al di fuori dei confini dell’Unione Europea, parlano italiano 520.000 americani, 200.000 svizzeri e 100.000 australiani. Il numero di navigatori italiani negli ultimi cinque anni è però rimasto stabile, contrariamente il numero di quelli dei paesi in via di sviluppo aumenta notevolmente, cosicché la proporzione di coloro che parlano la nostra lingua subirà una forte diminuzione e potremmo andare incontro a un rischio di sotto-rappresentazione, specialmente in confronto all’inglese”. Secondo i dati raccolti dai ricercatori, la penetrazione del web in Italia si attesta al 51,7%, con 30 milioni di internauti (circa il 6,3% di quelli dell’Ue) su 58 milioni di cittadini: la loro crescita è stata del 127,5% tra il 2000 e il 2010. Se questo è il quadro per la nostra lingua, possiamo immaginare quale sia per quelle che hanno un numero di parlanti molto inferiore. “Il dato è preoccupante”, prosegue Claudia Soria dell’Ilc-Cnr, “perché dal momento che le tecnologie linguistiche usate in Internet si basano su approcci statistici, se i dati messi a disposizione in una lingua sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua”. Lo studio condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler (Bernardo Magnini e Manuela Speranza) fa parte della ricerca Meta-Net cui hanno lavorato più di 200 esperti e documentata in 30 volumi della Collana di libri bianchi di Meta-Net: “21 lingue su 30 analizzate si collocano al livello più basso, con un supporto digitale ‘debole o assente’ in almeno una delle aree tecnologiche prese in esame (correttori ortografici e grammaticali, assistenti personali interattivi su smartphones, sistemi di traduzione automatica, motori di ricerca, etc.)”, spiega Soria. “L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. Anche basco, bulgaro, catalano, greco, ungherese e polacco, con ‘supporto frammentario’, si collocano tra le lingue ad alto rischio. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo, con ‘supporto modesto’. Nessuna lingua, però, ottiene ‘supporto eccellente’”.
“Sono risultati allarmanti”, conclude Hans Uszkoreit, coordinatore di Meta-Net. “La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro”.