Delle 6.909 lingue vive nel mondo 1.000 “vivono” nel web

1 febbraio, 2012 § 5 commenti

Quante  e quali sono le lingue presenti nella rete?

È una domanda che si è posto Kevin Scannell, un professore irlandese, che dal 2003 sta censendo i testi pubblicati sul web, dalle lingue indigene alle minoranze linguistiche. Sul suo blog indigenoustweets.blogspot.com scrive: «hai giorni nostri si contano 6.909 lingue in uso, ma di queste, quante sono presenti sulla rete? Tutto ovviamente dipende dai documenti che si vuole prendere in esame. Se si prende in considerazione gli studi linguistici il numero si aggira attorno a 4.000».

Per verificare questo dato ha realizzato un motore di ricerca che nel web cerca solo determinati testi che gli hanno permesso di recuperare informazioni utili alla mappatura. Solo quelli che lui chiama “Testi primari”, come i giornali, blog, tweets, articoli di Wikipedia e traduzioni della Bibbia, sono stati presi in considerazione per la ricerca.

Il risultato è visualizzato attraverso un grafico, impostato come un “albero genealogico” delle 1.000 lingue sino ad oggi individuate. La prossimità nella struttura delle lingue risulta da un confronto statisticamente coerente con i sistemi di scrittura.

La mappa è molto grande e vi rimandiamo al suo blog soprattutto per leggerla nel dettaglio e ottenere altre informazioni. Ogni lingua è colorata in base alla famiglia linguistica, (per esempio, tutte le lingue indoeuropee sono sui toni del verde, con diverse sottofamiglie: celtica, germanica, etc.).

Una porzione e un dettaglio della mappa delle lingue presenti sul web.

Nella visualizzazione ha utilizzato colori simili per le lingue dalla stessa area geografica, anche quando non c’era alcuna relazione genetica nota, e così Arawakan, Quechua e lingua Tucanoan (tutti provenienti dal Sud America) sono di tonalità viola, mentre Centro e Nord le lingue americane sono su toni del blu.

Se cliccate su un linguaggio si apre una scheda o finestra con la pagina di documentazione per la ISO 639-3 (identificatore di lingua), dove si trova un nome per la lingua in inglese e un link alla sua pagina di Ethnologue per ulteriori informazioni.

Quello che Scannell chiama “lingue” sono davvero “sistemi di scrittura”, si veda, ad esempio, i nodi separati per bo (tibetano) e bo-Latn (tibetano scritto in alfabeto latino). In un piccolo numero di casi ha monitorato macrolanguages, varianti regionali (ad esempio en, en-IE, en-ZA), e alcuni dialects. In totale ci sono 919 distinti codici ISO 639-3 (vedi nota) tra il 1.000 sistemi di scrittura rappresentati.

Scannell sta utilizzando questi dati, in collaborazione con gruppi linguistici in tutto il mondo per sviluppare le risorse di base che possano aiutare le persone a utilizzare al meglio la loro lingua online: i metodi di input da tastiera, correttori ortografici, i dizionari on-line, e così via. Questo lavoro mira a rafforzare le lingue attraverso i social media e attraverso la tecnologia a rivitalizzarle. Una volta che si conosce la distanza tra ogni coppia di lingue, siamo in grado di ricostruire un albero filogenetico. Per questo sta cercando anche un modo per visualizzare i dati in modo che l’albero si colleghi con un luogo su una mappa del mondo per comprendere e geolocalizzare visivamente la loro dislocazione.

NOTA

ISO 639-3 è la terza parte dello standard internazionale ISO 639, che elenca i codici brevi per l’individuazione delle diverse lingue parlate nel mondo. Si tratta di un codice assegnato composto da tre lettere seguito opzionalmente da due lettere che identificano rispettivamente il dominio (scope) e il tipo (type).

Dominio (scope)
individual (I) lingua a sé stante, indipendente
macrolanguages (M) lingua che genera sottotipi evoluti
collections, gruppo di lingue strettamente imparentate tra loro
reserved risevato a codifiche locali (da qaa a qtz)
specials (S) riservato a situazioni indeterminate o multiple (und, mul e zxx)
dialects sottotipo derivante da altra lingua (nessun dialetto inteso come termine italiano può essere incluso essa indica un sottotipo e discrimina unicamente una lingua vera e propria generata ed evolutasi a partire da una lingua matrice).

Tipo (type)
living (L) lingua attiva, usata come lingua madre da qualcuno in vita.
extinct (E) lingua estinta, non più utilizzata
ancient (A) lingua molto documentata ma estinta in tempi remoti
historical (H) lingua dalla quale in tempi storici è derivata una o più lingue
constructed (C) lingua artificiale.

English text

We have 6,909 living languages in the world 1,000 “live” on the web.
Kevin Scannell, an Irish native professor, since 2003 he gathering texts from the web written in indigenous and minority languages. On his blog indigenoustweets.blogspot.com writes: “Ethnologue lists 6909 living languages in the world, but how many have some presence on the web?  The answer depends greatly on what kinds of documents you include.  If one takes linguistic studies into account, the number might be as high as 4000. ” He develop, a search engine that searches only certain texts in the web that allowed him to retrieve the mapping information. Only what he calls “primary texts”: newspapers, blog posts, Wikipedia articles, Bible translations, etc., were considered for the research. The result is displayed through a graph, set up as a “family tree” of the 1,000 languages has so far identified where proximity in the tree is measured by a straightforward statistical comparison of writing systems.
The map is very big and we refer to his blog to read it in detail and get more informations. Each language is colored according to its linguistic family (details here).  For example, all Indo-European languages are greenish colors, with different subfamilies (Celtic, Germanic, etc.) being slightly different shades of green.
He also tried to use similar colors for languages from the same geographical region even when there is no known genetic relationship among them, and so Arawakan, Quechuan, Tucanoan languages (all from South America) are shades of purple, while Central and North American languages are shades of blue. If you click on a language you open a tab or window with the page of documentation for ISO 639-3 (language identifier), where it is, a name for the language in English and a link to its page for more information Ethnologue .
Scannell is using these data, together with language groups around the world to develop the resource base that can help people to make better use of their online language: keyboard input methods, spell checkers, dictionaries online , and so on. This work aims to strengthen the language through social media and through technology to revitalize them. Once you know the distance between each pair of languages, we can reconstruct a phylogenetic tree. Is looking for a way to display the data so that the shaft connects with a place on a map of the world to understand and visually geolocalize their distribution.

Tag:, , , , ,

§ 5 risposte a Delle 6.909 lingue vive nel mondo 1.000 “vivono” nel web

  • italo ha detto:

    che meraviglia…!
    grazie!
    :-)
    italo

  • awesome site ha detto:

    wonderful points altogether, you simply gained a brand new reader.
    What would you suggest in regards to your post that you made a few days ago?
    Any positive?

  • Additional Info ha detto:

    Thanks for your post. I also feel that laptop computers
    are getting to be more and more popular today, and now are often the only kind of
    computer employed in a household. It is because at the same time potentially they are becoming more and more very affordable, their
    processing power is growing to the point where they are as robust
    as personal computers coming from just a few in years past.

  • Maximilian ha detto:

    That is the right blog for anyone who needs to seek out out
    about this topic. You understand so much its virtually hard to argue with
    you (not that I actually would want…HaHa). You positively put a
    brand new spin on a subject thats been written about for years.
    Nice stuff, simply great!

  • web page ha detto:

    Thanks a lot for sharing this with all people you really understand
    what you’re talking about! Bookmarked. Kindly additionally consult with my site =). We can have a hyperlink alternate agreement between us!

Scrivi una risposta a web page Cancella risposta

Che cos'è?

Stai leggendo Delle 6.909 lingue vive nel mondo 1.000 “vivono” nel web su ↔g↨blog.

Meta