Foto archivio Università di Trento.

Formazione

STRUMENTI DIGITALI PER CONOSCERE LE LINGUE

La piattaforma Sketch Engine a disposizione della comunità accademica

11 luglio 2018
Versione stampabile
Andrea Binelli
di Andrea Binelli
Professore presso il Dipartimento di Lettere e Filosofia dell’Università di Trento.

Seguire i progressi dell’informatica umanistica è un modo ormai quasi naturale di sviluppare efficaci strumenti di analisi e di insegnamento per discipline quanto mai diverse. Il rischio, però, per chi si occupa di ibridi quali sono le tecnologie elettroniche per gli studi umanistici è coltivare l’uditorio privilegiato dei cosiddetti nativi digitali e trascurare la platea dei cultori per i quali è più faticoso vincere la reticenza iniziale verso i dispositivi informatici. In realtà chiunque fra gli addetti ai lavori oggi riconosce i giganteschi passi avanti registrati dalla linguistica dal momento in cui ha importato dalla branca computazionale l’utilizzo dei corpora. Quest’ultimi sono archivi digitali di produzioni scritte e orali ‘autentiche’, ossia, non inventate allo scopo di spiegare una norma grammaticale o di illustrare il significato di un termine. 

Le dimensioni dei corpora – si parla di miliardi di parole – e i criteri di selezione dei testi ne garantiscono la rappresentatività rispetto a una lingua o a una varietà linguistica. In altri termini, le osservazioni e le descrizioni linguistiche realizzate a partire dai testi di un corpus sono generalizzabili alla lingua o varietà linguistica di cui quel corpus è rappresentativo, sia questa il portoghese, il croato giuridico, il Business English o l’italiano accademico. 

Sketch Engine, piattaforma fondata dal lessicografo Adam Kilgariff, di corpora ne ospita centinaia, in tantissime lingue. Ma soprattutto mette a disposizione alcuni strumenti fenomenali che, in virtù di raffinati calcoli statistici, sono in grado di sintetizzare il comportamento sintattico, semantico e collocazionale (a quali altri termini si accompagnano) dei singoli termini. È il caso della funzione Word Sketch, che elenca le parole a fianco delle quali è solita essere usata una parola "chiave" – quella oggetto dell’indagine (lessicografica) – e le raggruppa in base alla loro relazione grammaticale con la stessa parola chiave: questi gruppi possono ad esempio riguardare i verbi che hanno una certa parola come complemento oggetto, oppure i sostantivi che seguono o precedono un certo aggettivo. Questo significa che, grazie a Sketch Engine, si può completare una frase in una lingua straniera aggiungendo qualsiasi concetto si voglia esprimere facendo affidamento su di una competenza grammaticale minima di quella lingua

Il presupposto teorico di questa rivoluzione epocale è che le quantità di dati empirici archiviate e messe a disposizione dai corpora elettronici illustrano il reale uso di una lingua – cosa viene detto, attraverso quali espressioni, quali forme grammaticali e quali ordini sintattici – meglio di qualunque sforzo di introspezione soggettiva, anche se realizzato da esimi e coltissimi linguisti. Insomma, i corpora contengono la lingua vera e non quella scolastica che, pur con le migliori delle intenzioni, hanno costretto generazioni di studenti a imparare a memoria espressioni inutili o comunque così rare da rasentare l’inutilità. 

Come accade ogni volta che si sviluppano nuovi e potenti strumenti di indagine scientifica, a essere sovvertita è niente meno che la nostra visione dell’oggetto di indagine, in questo caso la lingua, in virtù di una prospettiva inedita sui suoi meccanismi di funzionamento. Nello specifico si è abbandonata l’antica idea per cui il senso di un testo scaturiva dalla somma dei significati di ogni parola. Si è fatta largo, invece, una concezione di lingua per cui il senso di un testo è in primo luogo una somma di relazioni di senso fra parti di esso, laddove l’unità di significato non è più quindi la parola singola ma le collocazioni (i gruppi di parole) di varia lunghezza. 

I corpora hanno numerose applicazioni, alcune delle quali riguardano proprio la didattica e l’apprendimento, anche autonomo, delle lingue. Usare un corpus di spagnolo, ad esempio, è come avere un coltissimo madrelingua che risponde a ogni nostra richiesta di aiuto mentre scriviamo una mail, un curriculum o un saggio in quella lingua. Grazie all’adesione dell’Università di Trento al consorzio eduGAIN e al lavoro del Laboratorio Interdisciplinare per la Qualità e l'Innovazione della Didattica (LIQUID), gli utenti UniTrento possono accedere gratuitamente a Sketch Engine fino ad aprile 2022.

Per avere maggiori informazioni sulla piattaforma Sketch Engine si possono contattare il professor Andrea Binelli, amministratore dell'abbonamento Elexis/Sketch Engine e la professoressa Maria Micaela Coppola, coordinatrice del LIQUID.