ScriviBookTribu News

L’algoritmo che legge: Distant Reading

21 dicembre 2019

L’esperienza della lettura ha molte forme. Si può leggere per rilassarsi o per studiare, lentamente e assaporando ogni parola oppure freneticamente per arrivare alla fine di una bella storia, stesi comodamente sul letto o fra una fermata e l’altra dell’autobus.

La mente umana ha diversi modi di analizzare un testo scritto che gli si para davanti, notando un aspetto rispetto che un altro, soffermandosi più su alcuni termini e meno su altri.

Specialmente quando si parla di testi narrativi è chiaro che ogni lettore ha una sua personale visione della storia, che differisce da tutti gli altri.

Non è strano poi constatare che dopo aver letto una storia ogni rilettura porterà alla luce altri particolari, altre sensazioni o altre informazioni sfuggiti ad un primo sguardo.

L’interpretazione di ogni testo sarà dunque legata al suo lettore, creando quel circolo ermeneutico che il filosofo Gadamer reputerà infinito.

Ma se il lettore non fosse umano? Se fosse un computer a “leggere” una storia?

Queste sembrano premesse di un romanzo di fantascienza, ma parliamo di realtà: questo esperimento è stato tentato dal dottor Federico Boschetti (CoPhiLab & VeDPH Ca’ Foscari Venezia) e dalla dottoressa Giulia Venturi (ILC-CNR, ItaliaNLP Lab), dell’istituto di linguistica computazionale A. Zampolli del CNR di Pisa.

I due studiosi hanno utilizzato una tecnica della linguistica computazione, scienza che studia l’evoluzione del linguaggio umano utilizzando tecnologie informatiche, nota come Distant Reading.

Utilizzando degli algoritmi è stato possibile estrarre da testi narrativi informazioni sia sul loro contenuto sia sul loro stile. L’esperimento è stato in un primo momento condotto sui libri delle tre finaliste dell’ultimo concorso letterario Nazionale Doveva essere un romanzo d’amore di Linda Lercari, Una donna a bordo porta male di Stefania Magnano ed Ewen e il lago dei destini incrociati di Irene Galeotti.

Dai romanzi sono state esaminate caratteristiche lessicali, sintattiche, morfologiche o anche aspetti più generali (lunghezza media delle frasi, lunghezza delle parole ecc…). I risultati sono stati esposti durante la cerimonia di premiazione del quarto concorso letterario nazionale di BookTribu.

Gli autori e la community sono rimasti incuriositi, così abbiamo deciso di proseguire lo studio fornendo altri testi ai due ricercatori e un collaboratore d’eccezione: il nostro autore, nonché studente di linguistica computazionale, Pietro dell’Oglio. Abbiamo dunque concesso i due testi fantasy La Viola di Akenah e La Luna del Deserto, i romanzi vincitori delle passate edizioni del concorso Il mare bianco, L’alfabeto della mente e Il libro immortale e il romanzo storico Gladio di Luca Minardi.

Dopo un lungo studio i risultati sono stati esposti dai tre studiosi sfruttando la cornice del Seminario di cultura digitale rivolto agli studenti dell’Università di Pisa del 18 dicembre 2019. Il titolo del loro intervento riassume la domanda principale che ha spinto la loro ricerca “Cosa può dire un algoritmo del lavoro di uno scrittore emergente?”.

La rassegna dei seminari è stata sponsorizzata dal Laboratorio di cultura digitale, associazione che opera all’interno dell’ateneo pisano e che promuove la creazione di progetti e di esperienze didattiche in cui le tecnologie informatiche incontrano i tradizionali saperi umanistici.

Ma cosa può dedurre un algoritmo quando si trova di fronte alla travagliata storia di Lorenzo nel romanzo della nostra Carmina Trillino? Trova dei contatti fra le distopie immaginate da Silvia Lodini e da Gian Luca Sechi nei loro romanzi? Come ha “interrogato” i romanzi dei nostri autori?

Si potrebbe dire che il seminario è il risultato di uno studio di tipo verticale, diacronico, sul percorso di un’opera(prima stesura, intervento di editing, versione post editing ecc…) e orizzontale, sincronico, sulle somiglianze e le differenze delle opere appartenenti ad autori e generi letterari distinti.

Nel primo caso, il dott. Boschetti ha lavorato sulle varianti d’autore, che rivelano il modus operante di uno scrittore e in taluni casi anche il suo profilo psicologico. Gli autori, infatti, non differiscono tra di loro solo per quanto riguarda lo stile, ma anche per alcuni tratti psicologici che identificano il loro lavoro (scrittura sicura, tormentata, puntigliosa, ecc.); inoltre, un altro aspetto interessante riguarda l’intervento editoriale che connette l’asse sintagmatico del singolo romanzo con quello paradigmatico della lingua e quello normativo di informazioni quali genere letterario o il gusto dell’epoca in cui l’opera è stata scritta. Tutto ciò si complica nell’era del digitale, in quanto abitualmente lo scrittore non sempre tiene traccia di tutti le versioni utilizzate.

Già solo prima di inviare la propria opera alla casa editrice, un autore avrà prodotto diverse versioni della stessa prima di arrivare alla versione che è stata caricata effettivamente sul portale di BookTribu. Prima di arrivare all’effettiva pubblicazione, l’opera è stata soggetta ad un lungo lavoro di revisione da parte dell’editor e dell’autore e molti step intermedi sono finiti nel “cestino”. È importante dunque sensibilizzare gli autori a individuare e conservare i materiali digitali preparatori dell’opera edita.

Lo studio del dott. Federico Boschetti ha messo in luce come l’editor, nella fase di correzione di bozze tende a una sostituzione di termini ad alta frequenza con iponimi, a un’eliminazione delle endiadi e, spesso, alla sostituzione sistematica di una forma con un’altra.

L’analisi di tipo orizzontale, invece, ha visto impegnati la dott.ssa Venturi e Pietro dell’Oglio. Lo studio ha visto un’analisi del profilo linguistico di alcune delle opere della collana di BookTribu, ricostruito sulla base dell’estrazione automatica del testo linguisticamente annotato di un’ampia gamma di caratteristiche linguistiche rilevate rispetto ai diversi livelli di annotazione. Si tratta di caratteristiche di base, come la lunghezza media delle frasi e delle parole, e caratteristiche di tipo lessicale, morfosintattico e sintattico. A questo punto sono state condotte quattro analisi per provare a rispondere alle seguenti domande:

  • Qual è lo stile di ogni autore?
  • Esistono caratteristiche comuni tra i generi letterari scelti dagli autori di BookTribu?
  • Gli autori maschili di BookTribu scrivono in modo diverso dalle autrici?
  • In che modo il lavoro di post editing influisce sulle caratteristiche dei romanzi pre-editing?

In conclusione, è stato mostrato come ciascun autore abbia uno stile peculiare che si distingue soprattutto per la complessità nel periodare e sull’uso di alcune categorie morfosintattiche. Le variazioni in un confronto fra i generi narrativi della collana BookTribu riflettono per buona parte quelle emerse nel confronto tra gli stili dei vari autori, indice del fatto che lo stile del singolo scrittore dipende dal genere letterario scelto e viceversa. Gli autori e le autrici, di contro, non sembrano presentare variazioni significative a livello lessicale, morfosintattico e sintattico; invece, è chiaro come il lavoro di editing possa influire in modo particolare sul lessico e sulla distribuzione di alcune categorie morfosintattiche, in modo meno incisivo (ma comunque importante) sulle caratteristiche sintattiche.

E cos’altro ha scoperto l’algoritmo? Che altre osservazioni si possono fare? Tutto questo lo sapremo… nella prossima puntata!

Lo studio è tuttora in corso, quindi chissà cos’altro emergerà dai lavori dei nostri autori e che piega prenderà il futuro, d’altronde, come diceva Magherita Hack Il divertimento della ricerca scientifica è anche trovare sempre altre frontiere da superare […] cercare sempre di progredire pur sapendo che probabilmente ci si avvicinerà sempre di più a comprendere la realtà, senza arrivare mai a capirla completamente.

Per il momento non ci resta che ringraziare la dott.sa Venturi, il dott. Boschetti e Pietro, augurandoci che i loro “fondi principali”, ovvero la loro passione e la loro sete di conoscenza, regalino altre letture di storie nuove o già conosciute.

Per i più curiosi fra di voi vi lasciamo il link al video del seminario completo: https://youtu.be/42TYgY4vrV4

Buona visione!

 

SCRITTO DA La Redazione
voti3 mi piace
commenti3 commenti
Condividi su

Torna su