Era il 2012: nasceva Project Debater
A sette anni dall’esibizione di Watson, capace di stupire battendo i campioni in carne ed ossa del gioco Jeopardy!, IBM prova nuovamente a sbalordire presentando la sua nuova creatura: IBM Project Debater.
Dopo il brillante successo del 2011 era tempo per Big Blue di mettere in cantiere una nuova impresa. «Tutti tra migliaia di ricercatori … ricevettero la stessa e-mail che chiedeva loro quale dovesse essere la prossima grande sfida nel campo dell’IA che la Ricerca IBM dovesse prefiggersi», ricorda Noam Slonim, membro del centro di ricerca IBM di Haifa (Israele). Non vi erano specifiche precise, nondimeno il nuovo progetto avrebbe dovuto soddisfare determinate caratteristiche, essere innanzitutto «… scientificamente interessante e stimolante e avrebbe dovuto avere un qualche valore commerciale. Qualcosa di grande, qualcosa che avrebbe fatto la differenza». Fu proprio Slonim a proporre di perseguire l’obiettivo di creare ed addestrare un’intelligenza artificiale che fosse in grado di dibattere in maniera significativa con una controparte umana. Dapprincipio solo un suggerimento come tanti che, infine, un anno dopo riuscì a spuntarla sulle altre proposte concorrenti e divenne la nuova sfida su cui la Ricerca IBM aveva deciso di puntare.
Frutto di sei anni di lavoro di un team IBM coordinato dal laboratorio di Haifa in Israele, il progetto mira a sviluppare un’IA in grado di interagire compiutamente con gli umani. Ma, «Che cos’è Project Debater?». La domanda la pone la stessa Big Blue, che provvede a fornire anche la risposta: «Un sistema che porta l’intelligenza artificiale nell’arte del dibattito». In sostanza, come si premura di rimarcare l’azienda, «Project Debater è il primo sistema di intelligenza artificiale in grado di discutere con gli esseri umani su argomenti complessi».
I fatti
Il Watson West di San Francisco lo scorso mese di giugno è stato sede di due insoliti dibattiti tra esperti umani e l’ultima mirabilia sfornata da IBM. Lo schema di confronto prescelto assegnava un totale di dieci minuti agli oratori, secondo questo ordine: quattro minuti per esporre la propria tesi, quattro minuti per replicare e confutare quella dell’avversario, due minuti per un enunciato conclusivo.
L’oggetto della discussione del primo contradditorio è stato: “Dovremmo sovvenzionare l’esplorazione spaziale?“. Contraria Noa Ovadia, campione israeliano di dibattito nel 2016, a favore la macchina.
Il Project Debater ha argomentato la propria tesi sostenendo che supportare l’esplorazione spaziale aiuta a far progredire la scienza, apre la mente alle nuove generazioni e diviene fonte di ispirazione per esse: «… ispira i nostri ragazzi a perseguire una formazione e delle carriere nelle scienze, in materie tecnologiche e nella matematica». Ha persino aggiunto una notazione che strizza l’occhio alla grandeur degli USA: «… possedere un programma di esplorazione spaziale è un elemento fondamentale dell’essere una grande potenza». Che abbia cerato di accattivarsi il pubblico presente?
Secondo Noa Ovadia, invece, i fondi potrebbero essere destinati ad altri ambiti di ricerca, qui, sulla terra. La replica della macchina ha evitato lo scontro frontale e si è focalizzata sul fatto che le ricadute degli investimenti nell’esplorazione spaziale, gli auspicabili benefici tecnologici ed economici che ne deriverebbero, sarebbero superiori alle spese affrontate: «È piuttosto facile dire che ci sono cose più importanti su cui investire del denaro, e non lo metto in discussione. Nessuno sta affermando che questo sia l’unico articolo sulla nostra lista della spesa. Ma non è questo il punto. Dato che sovvenzionare l’esplorazione dello spazio gioverebbe sicuramente alla società, ritengo che sia qualcosa che il governo dovrebbe perseguire».
Il secondo dibattito ha visto l’IA di IBM opposta a Dan Zafir, un altro esperto israeliano, sul tema: “Dovremmo incrementare l’uso della telemedicina?”. Il Debater in entrambe le discussioni ha fatto sfoggio della propria “preparazione” e della vastità delle fonti a cui attinge, con citazioni che andavano da «… uno sceicco degli Emirati Arabi Uniti, al numero di posti di lavoro che l’esplorazione spaziale avrebbe prodotto – stando ad un ministro tedesco degli affari economici».
A conclusione delle propria replica l’automa si è affidato ad una battuta: «Sono un autentico sostenitore del potere della tecnologia … com’è giusto che sia». Che lo abbia fatto per mascherare la difficoltà di rispondere ai rilievi mossi dal proprio interlocutore, come suggerito da Dieter Bohn, o per cercare di ingraziarsi l’uditorio risulta arduo da stabilire. L’ironia della macchina non è stata però involontaria, né dovuta al caso o ad un qualche errore, bensì è frutto del lavoro dei tecnici IBM. A più riprese, infatti, l’IA si è avventurata in battute o scherzi, talvolta riusciti, talora meno.
Il verdetto
È importante rilevare come il Debater, «… a parte una breve introduzione», non sia stato istruito in precedenza, né abbia seguito un qualche copione preventivamente predisposto. Ed Arvind Krishna, responsabile della Ricerca presso IBM, ci tiene a sottolinearlo: «Per le prime dimostrazioni di questa nuova tecnologia, abbiamo operato una scelta da un elenco di argomenti selezionati per garantire un dibattito significativo. Tuttavia Project Debater non è mai stato addestrato sugli argomenti». L’oggetto del dibattito è stato scelto infatti all’interno di una lista composta da un centinaio circa di argomenti, per i quali l’IBM ritiene che l’IA, in base ai dati immagazzinati in memoria, sia in grado di misurarsi con un umano. Noam Slonim, «… ha stimato che la tecnologia potrebbe sostenere un dibattito “significativo” su quei 100 argomenti il 40% delle volte».
La mole di informazioni su cui il Project Debater ha potuto fare affidamento è vastissima. Essa comprende diverse centinaia di milioni di documenti delle tipologie più disparate: dalle pagine di Wikipedia ad articoli e saggi, nonché materiale audio e video, «… una raccolta di 300 milioni di articoli, di notizie e lavori accademici, precedentemente indicizzati ai fini di una rapida ricerca». Indicizzati e rigorosamente vagliati dai tecnici IBM.
A conclusione dei due confronti un pubblico di giornalisti ed analisti è stato chiamato a decretare un vincitore in base a due categorie fondamentali: l’esposizione degli argomenti e l’arricchimento in termini di conoscenza apportato dai contendenti. In sintesi, l’improvvisata “giuria” ha riconosciuto che la creatura di IBM ha mostrato di possedere elementi di conoscenza rilevanti sui temi sollevati, benché gli avversari in carne ed ossa le siano stati superiori nell’esposizione. Mentre nel primo dibattito la vittoria è andata all’essere umano, nel secondo l’IA è stata ritenuta più persuasiva. Se Noa Ovadia è riuscita a portare dalla sua parte due spettatori, ben nove persone hanno ammesso di aver cambiato opinione riguardo l’utilizzo della telemedicina grazie alle argomentazioni fornite dal Project Debater. Sebbene, come rilevato dal Guardian, «… c’erano molti membri dello staff IBM nella stanza e potrebbero aver fatto il tifo per la propria creazione», stavolta non si è assistito ad un trionfo schiacciante dell’IA, bensì si può parlare di un pareggio. Un pareggio che sta persino stretto a noi umani.
E una seconda esibizione, tenutasi nel mese di luglio in Israele davanti ad un pubblico di giornalisti, lo ha comprovato. La macchina IBM opposta a due esperti israeliani di dibattito, Yaar Bach e Hayah Goldlist Eichler, è apparsa meno brillante. Le questioni affrontate sono state rispettivamente: la sorveglianza di massa e l’ingegneria genetica. Come nel precedente evento organizzato a San Francisco, l’automa IBM è stato in grado di superare i propri avversari in carne ed ossa quanto a mole di informazione e conoscenza. Tuttavia, ancora una volta, è stato inferiore all’uomo nell’avanzare le proprie argomentazioni e, per così dire, nell’enfasi dell’esposizione. In conclusione, «il sistema e Bach hanno pareggiato, tuttavia nel secondo turno la vittoria è andata a Goldlist Eichler, che è riuscito a far cambiare idea a più persone tra il pubblico, nonostante abbia ottenuto un punteggio inferiore quanto a conoscenza dell’argomento».
The day after
«Pensateci su un momento. Un sistema di intelligenza artificiale impegnato con un’esperta umana in dibattito, ha ascoltato la sua argomentazione ed ha risposto in modo convincente con un proprio ragionamento, senza copione, alfine di persuadere il pubblico a considerare la propria posizione su un argomento controverso». Arvind Krishna ci proietta di colpo in un’altra dimensione che, sino ad oggi, era riserva di caccia per film di fantascienza o documentari su un plausibile futuro, più o meno venturo. D’emblée, pur con tutte le incertezze e le carenze mostrate dalla macchina, un tale futuro è divenuto in parte realtà. Quanti infatti, tecno entusiasti esclusi, avrebbero puntato o solo creduto possibile una simile performance dell’intelligenza artificiale nel breve termine? Nonostante i limiti evidenziati, l’esibizione dell’IA lascia in effetti stupefatti. Una «tecnologia ragguardevole», è stato il commento di Chris Reed, professore presso la University of Dundee.
La stessa Ovadia si è mostrata impressionata: «Sono sorpresa … La tecnologia è davvero sconcertante nei termini di quante capacità cognitive propriamente umane è in grado di svolgere contemporaneamente». La campionessa israeliana ha avuto modo di misurarsi con l’automa IBM per alcuni mesi, ai fini della messa a punto definitiva del sistema: «All’inizio ero sbalordita, sia dal semplice linguaggio, ma anche dalla costruzione dell’argomentazione … La capacità di ascoltare e quindi fornire una replica significativa a quello che avevo detto».
Proprio le “qualità” peculiari indicate dalla Ovadia sono tra le principali caratteristiche che rendono il Project Debater, una «tecnologia alquanto speciale … una pietra miliare significativa nello sviluppo di una tecnologia di Intelligenza Artificiale», secondo quanto affermato da Daniel Melka, CEO e Country manager di IBM Israele. In sostanza l’originalità del Debater si basa su tre competenze innovative, «… tre capacità cruciali, ognuna delle quali apre nuovi orizzonti nel campo dell’IA».
1) Innanzitutto scrittura ed esposizione di un discorso basato sui dati a disposizione. «La prima impresa è stata la creazione di un computer in grado di generare un’opinione – simile all’editoriale di un giornale – costruita sui dati ed esprimerla con frasi complete».
2) In secondo luogo ascolto della replica del proprio interlocutore, al fine di riconoscere ed estrapolare i concetti più importanti. «La seconda capacità consente al robot di ascoltare e comprendere i propri avversari, permettendogli di identificare affermazioni chiave, nascoste nel linguaggio parlato lungo e continuo».
3) Infine, la realizzazione di un grafico di conoscenza unico, relativo ai dubbi manifestati dall’uomo, allo scopo di consentire ragionamenti “etici”. «La terza impresa è stata dare al computer la capacità di esprimere dei dilemmi umani in modo succinto e con argomenti di principio».
La performance del Debater non è stata tuttavia esente da pecche. Oltre ad aver ripetuto più volte lo stesso concetto utilizzando parole differenti, ad un certo punto, nel corso del dibattito inerente l’esplorazione spaziale, ha sostenuto che questa «… è più importante dell’[avere] buone strade o scuole migliori o una superiore assistenza sanitaria». Un argomento non proprio condivisibile …
A parte alcune incertezze linguistiche, in alcuni casi si è avuta l’impressione che la costruzione della frase non fosse del tutto “naturale”: talvolta il segmento iniziale di un enunciato non è stato seguito da una seconda parte tale da apparire fluida; talora poi, aneddoti e citazioni sono sembrati quasi casuali. Ad un certo punto, nel mezzo di una frase, l’inserzione di un “voiceover” (voce fuori campo) ha rivelato che la macchina aveva attinto alla trascrizione di un video.
Nondimeno la nuova “mirabilia” di IBM ha tenuto botta. Come sottolinea Chris Reed, abbiamo assistito ad un’esibizione che denota un progresso tutt’altro che banale: «Questo è davvero un passo avanti significativo … Ritengo che ciò che mi ha colpito è stata la combinazione delle tecniche di Intelligenza Artificiale. Affrontare qualcosa come un dibattito non è cosa che o la va o la spacca. … Devi essere in grado di risolvere molti problemi e poi riunire tutti questi problemi in una soluzione ingegnerizzata».
Conclusioni
La macchina ha dimostrato di mancare di empatia, ha palesato gli attuali limiti della ricerca nel campo dell’intelligenza artificiale ed ha fatalmente fornito ulteriore materia alla discussione inerente il futuro e la funzione dell’IA. Inoltre, nonostante i tanti proclami i quali pongono l’accento plaudendo ad una collaborazione sempre più stretta tra uomo e macchina, con l’IA, ci viene detto, a svolgere un ruolo eminentemente ancillare, il fantasma della competizione si riaffaccia prepotente. Che parte avrà l’uomo in tutto questo, quale funzione ricoprirà? Riuscirà a conservare una sua “utilità”, preserverà un proprio spazio di esistenza, una peculiare unicità all’interno di un perimetro che appare ogni giorno più esiguo, oppure diverrà un elemento marginale, persino ridondante?
In ultimo, a ben guardare, Project Debater lascia intravvedere anche un proprio lato oscuro …
L’IBM immagina per Project Debater un futuro ruolo da “advisor”. «Riteniamo che ci sia un enorme potenziale positivo nell’intelligenza artificiale che sia in grado di comprendere noi umani», afferma Krishna. Un consigliere esente da pregiudizio, scevro da emozioni e pertanto immune a condizionamenti umorali ed ambientali, in grado di fornire una visione oggettiva di un dato argomento. «Ciò può accrescere il livello del processo decisionale basato sull’evidenza», rileva Chris Reed.
Uno strumento persino in grado di offrire al contempo i pro ed i contro insiti in una decisione. «Nel corso del tempo, e negli ambiti aziendali compatibili con questa applicazione, ci muoveremo sempre più verso l’utilizzo di questo sistema di IA per agevolare il ragionamento, il problem solving, su questioni che non sono ancora state risolte», tiene a ribadire IBM.
Beninteso, si evidenzia con forza a più riprese, che il ruolo della macchina non sarà quello di prendere le decisioni (sostituendosi all’uomo), bensì contribuire alla discussione, «… agire come un’altra voce al tavolo». La funzione del Project Debater, secondo Big Blue, «sarà quella di ‘facilitatore’ nel far meglio circolare pensieri, opinioni, punti di vista e riflessioni per arrivare ad una sintesi efficace ed efficiente … un ‘Thinker’ al servizio di pensatori in carne ed ossa».
Una prospettiva stimolante, persino rassicurante. Immaginiamo però, per un attimo, una dimensione altra. Un futuro distopico, distinto e discosto dalle “magnifiche sorti e progressive” che ci prospetta la narrazione dell’inarrestabile progresso tecnologico. Immaginiamo un mondo saturo di dati, affollato di notizie, con la confusione che attanaglia l’informazione. Un’informazione popolata e afflitta da fake news …
E se le qualità di strumenti come il Project Debater venissero impiegate piuttosto che per mettere ordine tra le notizie e dirimere il caos delle informazioni, invero per accrescere tale disordine, nonché orientare le opinioni verso una direzione piuttosto che un’altra? Qualora invece che individuare e rivelare le fake news lo si utilizzasse per confezionarne di nuove, inondare la rete, e non solo, di notizie false o distorte, sostituire il vero con il verosimile? Sarebbe possibile? È presumibile che lo sia e senza nemmeno grande sforzo, soprattutto nel mondo dei social, dove la comunicazione e la notizia non deve essere per forza particolarmente raffinata o articolata.
Un simile strumento potrebbe divenire una sorta di Thinker “alla carta”. Peggio, un Think thank, come ce ne sono molti, ma automatizzato, in grado confezionare suggestioni e “arrangiamenti” a getto continuo, di influenzare, orientare, persuadere. Uno strumento capace di assemblare fatti ed elementi con precisione sartoriale, di unire e disgiungere, per giunta poi, ad un ritmo inimmaginabile per un essere umano. Una realtà lontana da noi, eccessivamente distopica? Chissà …