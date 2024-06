“Dimmi chi frequenti e ti dirò chi sei” è una fra le molte varianti di un proverbio popolare che in Fermo e Lucia guida Donna Prassede nel comprendere il prossimo. È con tale saggezza popolare che, paradossalmente, le raffinate tecniche dell’intelligenza artificiale generativa trattano il linguaggio. I modelli di intelligenza artificiale (IA) generativa trainanti e più avanzati sono quelli linguistici del tutto simili a quelli strutturalistici (olistici); la lingua è un sistema strutturato di relazioni, di somiglianze e di differenze: in tali modelli tutto è sintassi e niente è semantica. I modelli linguistici che vengono usati dalle reti neurali sono una combinazione fra metodi logici e statistici. I primi erano sfruttati anche dall’IA classica, ma le reti fanno uso massiccio dei secondi. Per esempio, una rete può esaminare un insieme di dati ed estrarre le frequenze con cui alcune parole si trovano associate ad altre. Alcune associazioni saranno molto frequenti (per esempio fra “cane” e “animale”), altre meno frequenti (“cane” e “vegetale”). Si crea così un sistema di relazioni, di somiglianze e di differenze non diverso dall’idea saussuriana di lingua come sistema strutturato.

Il successo che l’IA sta conseguendo nel trattare le lingue naturali è in gran parte misterioso (è “la materia oscura dell’IA”, ha dichiarato Y. Le Cun). Ma non lo è meno la capacità umana di usare il linguaggio. Che ci sia un nesso?

Forse nessun altro secolo come il Novecento ha dedicato tanta attenzione al linguaggio. Non solo la fondazione della linguistica come scienza ad opera di Ferdinand de Saussure è figlia del secolo ma lo studio del linguaggio come tale è stato al centro degli interessi della logica, dell’antropologia, della psicoanalisi, della psicologia e, infine, dell’IA impegnata fin dall’origine nell’elaborare linguaggi artificiali e nel simulare quelli naturali.

Le teorie contemporanee del linguaggio hanno convenuto nel respingere come ingenua l’idea che considera la lingua come una nomenclatura: il significato sta nelle relazioni che le parole hanno tra loro piuttosto che con le cose e le idee. Questa tesi caratteristica è originariamente sorta nell’ambito dello strutturalismo e comporta due conseguenze peculiari, la prima taciuta e la seconda rivendicata: che le parole abbiano un valore sganciato dal riferimento al mondo e che il pensiero senza linguaggio sia niente.

Conseguenze esplicite e implicite del genere sono diventate patrimonio comune, condivise anche da posizioni che non hanno a che fare direttamente con la linguistica strutturalistica di de Saussure: consapevolmente o no sono presenti perfino nell’IA. Prenderne atto può giovare a chiarire alcune questioni che compaiono nell’attuale discussione intorno alle capacità dell’IA di ultima generazione. Fra queste è tornata (poiché ricorre periodicamente) quella se e, nel caso, quanto le macchine siano (o possano essere messe) in grado di comprendere il linguaggio.

Il tema è tanto antico quanto rilevante perché l’uso corretto del linguaggio è da sempre considerato indizio sufficiente per la presenza del pensiero. Quando già nel XVII si pose il problema, rispondervi (come fece Descartes, per esempio) era facile: un automa può solo ripetere ciò che ha “registrato” nei suoi meccanismi, non possiede dunque né comprensione del linguaggio né tanto meno pensiero. Date le capacità limitate di usare il linguaggio naturale che le macchine avevano fino a poco tempo fa, tutto sommato negare loro la comprensione era ancora banale, perfino all’epoca del dibattito più rilevante che negli anni Ottanta si è svolto sull’argomento suscitato dagli interventi di J. Searle. Dalla mera manipolazione di simboli formali, cioè dalla sintassi, non si ottiene la semantica e quindi neppure la comprensione.

Finché le macchine usavano il linguaggio in modo primitivo ovviamente la questione era soltanto accademica. Ma da quando, come accade oggi, le reti neurali profonde e l’IA generativa hanno cominciato (si tratta, appunto, solo dell’inizio) a mostrare una padronanza decisamente buona del linguaggio naturale si è riproposta la domanda se dietro tale padronanza ci sia, o possa esserci dopo ulteriori progressi della tecnologia, anche comprensione. Tuttavia pare che, su questo tema, l’IA generativa attuale non comporti nessuna novità significativa rispetto all’IA classica (simbolica): l’uso di regole esplicite della seconda è un approccio tanto formale al linguaggio quanto lo è quello “strutturale” della prima.

La radice della questione non sta nel tipo di IA ma nell’approccio al linguaggio che l’IA eredita dalla linguistica: se il “significato” di una parola consiste nel ruolo che assume in una rete di affinità e di differenze, e dunque è determinato in modo tutto interno al sistema senza rapporto con il mondo, allora è banale conseguenza che non ci sia nessuno spazio per la semantica. Il modo in cui le reti neurali attuali vengono addestrate per trattare il linguaggio si fonda su un principio efficacemente espresso dal linguista J. Firth (uno dei padri della semantica distributiva) in una celebre battuta che risale agli anni Cinquanta del secolo scorso: “a word is characterized by the company it keeps” (il proverbio di Donna Prassede sembra essere dunque internazionale). È facile vedere quanto il punto di vista di Firth sia analogo a quello di de Saussure secondo il quale “la lingua è un sistema in cui tutti i termini sono solidali ed in cui il valore dell’uno non risulta che dalla presenza simultanea degli altri”. Dunque se l’IA non accede alla semantica non è un problema dell’IA ma della teoria del linguaggio che le sta dietro.

L’ipotesi che sta alla base dei modelli linguistici usati in IA è che la similarità distributiva di una parola equivalga alla similarità semantica: se il contesto in cui si trova una parola fornisce informazioni sul suo significato, le parole che compaiono in contesti linguistici simili avranno significato simile. Quindi basterà sottoporre a una rete neurale una quantità sufficientemente ampia di ricorrenze di parole (il motto di un gruppo di ricerca di Google è “la vita comincia a un miliardo di esempi”) perché questa ne apprenda l’uso corretto. L’ipotesi ulteriore che una volta era data per scontata (per es. da Descartes) e che invece comincia a vacillare è che l’uso corretto del linguaggio ne implichi la comprensione. Che l’ipotesi ulteriore non sia scontata lo sappiamo da quanto è già accaduto per le capacità di calcolo dell’IA tradizionale: che i computer portatili siano più bravi degli esseri umani nell’applicare le regole delle quattro operazioni non significa che capiscano l’aritmetica nello stesso senso in cui lo fanno gli esseri umani.

Nei modelli linguistici distributivi una parola è una sorta di punto in uno spazio individuato da un insieme di coordinate. Poiché le relazioni fra le parole possono essere di tipi diversi (sinonimia, omonimia, contrarietà, contesto d’uso ecc.) e ogni tipo di relazione dà luogo a uno spazio semantico, lo spazio complessivo in cui si colloca una parola è multidimensionale. Un semplice calcolo dimostra che il numero di parametri che servono per individuare una singola parola all’interno del lessico di una lingua naturale, e che le reti riescono a gestire grazie alla loro potenza computazionale, è enorme.

Ma è sul piano della potenza di calcolo che si devono confrontare l’IA e l’intelligenza naturale? Non è dimostrato che la comprensione del linguaggio scaturisca magicamente da una sufficiente potenza di calcolo e che questa basti per fare il salto dalla sintassi alla semantica. Se le reti future mostreranno inequivocabilmente di comprendere e non solo di usare il linguaggio allora sì, la sintassi e la computazione saranno state sufficienti. Ma anche il tal caso resterebbe da capire se quella è la strada che l’evoluzione biologica ha intrapreso per distillare significati dall’intelligenza naturale: in fondo, al di là delle somiglianze, le differenze fra reti artificiali e reti naturali restano rilevanti: per fare un esempio la velocità con cui i segnali viaggiano nella rete. Il tentativo di “spremere” la comprensione dei significati dalla sintassi dovrà allora essere archiviato con lo stesso epitaffio che Manzoni suggeriva per la stessa Donna Prassede “quando si è detto che è morta si è detto tutto”.

Che lo sviluppo delle capacità linguistiche sia interamente basato sulla mera computazione di tutto l’insieme di parametri di un intero lessico potrebbe essere un compito eccessivo per le risorse computazionali di un organismo. Dopotutto l’intelligenza naturale sta in un corpo biologico dotato di sensibilità a stimoli specifici e che interagisce con un ambiente, e dunque è ragionevole ipotizzare che disponga anche di una serie di filtri che abbattono il numero di items da considerare, vincolandone il numero al contesto dato, all’insieme di relazioni pertinenti alla situazione e così via. Come da tutto ciò si possa giungere al regno della semantica non è chiaro. E per la verità non esiste nemmeno una teoria del significato accettata e condivisa. Ma è chiaro che se non è disponibile una teoria non possiamo neppure averla implementata nell’IA. Sarebbe dunque un caso veramente sorprendente se, senza avere idea di come l’intelligenza naturale generi la semantica, avessimo costruito un’intelligenza artificiale (per la verità in gran parte frutto di bricolage e della benevolenza della “dea Serendipità”) in grado di farlo. Quando si parla di opacità dell’IA non si dovrebbe dimenticare che c’è un’opacità relativa al modo in cui l’intelligenza naturale stessa tratta il linguaggio.

In foto Ferdinand de Saussure