Anche l’India fa il suo ingresso nel campo dell’intelligenza artificiale. La Repubblica indiana (Bhārat in lingua hindi), si prepara a lanciare il suo modello linguistico Hanooman, un modello di grandi dimensioni (Large language model, Llm) simile a ChatGPT, in grado di operare in 11 delle 22 lingue ufficiali del Paese. Il lancio ufficiale di Hanooman è previsto per il prossimo mese.
Presentato da Seetha Mahalaxmi Healthcare (Sml) in collaborazione con l’ecosistema BharatGPT, guidato dall’IIT Bombay, guidato dall’IIT, Hanooman mira a rivoluzionare settori chiave come la governance, la sanità, l’istruzione e i servizi finanziari. L’ecosistema BharatGPT è un consorzio di ricerca guidato dall’Indian Institute of Technology (IIT) Bombay, supportato da altre sette IIT, oltre al Dipartimento della Scienza e della Tecnologia, SML. Oltre al sostegno del governo e delle università indiane, il progetto vede anche il coinvolgimento di una filiale di Reliance Industries, la Reliance Jio, uno dei principali operatori di telefonia mobile dell’India, alla cui guida c’è il trentenne Akash Ambani, figlio di Mukesh Ambani, l’uomo più ricco dell’Asia.
India: cos’è Hanooman e come funziona
Hanooman è stato chiamato così in onore della divinità induista Hanuman nota per la sua forza e intelligenza. L’obiettivo è rendere accessibile le tecnologie avanzate di intelligenza artificiale fino a 11 lingue locali, servendo una demografia indiana diversificata. È una serie di modelli linguistici indicizzati di grandi dimensioni addestrati su 22 lingue indiane, con varianti fino a 40 miliardi di parametri.
Hanooman ha capacità di IA multimodali per generare contenuti in diversi formati, come testo, voce e video. Ganesh Ramakrishnan, uno dei promotori del progetto e responsabile del dipartimento di Ingegneria e Scienze Informatiche presso l’IIT Bombay, ha dichiarato che Hanooman consentirà la conversione della voce in testo, facilitando così l’accesso alle informazioni per milioni di indiani che non sono in grado di leggere o scrivere. In futuro, il modello verrà esteso anche alle lingue non considerate nella versione iniziale.
Una delle principali sfide nella creazione di grandi modelli linguistici in India è ottenere set di dati di alta qualità nelle lingue locali. Migliorare la qualità di questi set di dati, che comprendono testi, audio e video nelle lingue indiane, è il primo passo fondamentale. Hanooman si unisce ad altri modelli linguistici nella corsa all’intelligenza artificiale, come il Krutrim di Ola, l’OpenHathi di SaravamAI e il modello Airavata dell’IIT-Madras.
Per quanto riguarda la regolamentazione dell’IA, si prevede che il governo indiano presenti un progetto di quadro normativo sull’intelligenza artificiale entro luglio 2024.
Intelligenza artificiale: le sfide dell’India nel settore
L’India, pur essendo nota per la sua inclinazione verso la tecnologia, aveva finora mantenuto un certo ritardo nel campo dell’Intelligenza artificiale. Con l’avvento di Hanooman, si prevede che questo divario venga colmato, segnando un importante passo avanti nell’obiettivo del Paese asiatico di emergere come leader globale nell’IA.
Inoltre, il progetto rappresenta una grossa sfida anche in ambito linguistico. La diversificazione geografica del consorzio di ricerca è stata deliberata per rendere l’Intelligenza Artificiale accessibile a una vasta parte della popolazione indiana che non parla inglese. C’è poi anche la problematica linguistica nativa. L’India conta circa 22 lingue. Attualmente, i modelli possono operare in 11 lingue indiane che includono alcune delle lingue di ceppo indo-ariano come l’Hindi, il Bengali e il Marathi, parlato rispettivamente a Delhi, Kolkata e Mumbai e anche lingue dravidiane del Sud come il Tamil, il Telugu e il Malayalam. L’obiettivo futuro sarà quello di estendere le capacità del modello per coprire tutte e 22 le lingue indiane.
Non mancano alcuni dubbi sulle buone intenzioni del progetto. Stranamente tra le prime undici lingue inserite spicca l’assenza dell’Urdu, settima lingua più parlata in India e predominante tra la popolazione musulmana. Un segnale, insieme alla scelta del nome del modello e del consorzio, che hanno sollevato interrogativi sulle intenzioni di inclusione del progetto. Questa mancanza è, infatti, particolarmente significativa dato che la comunità musulmana presenta indicatori sociali e di reddito più bassi e potrebbe trarre maggior beneficio dall’accesso diretto a informazioni educative e sanitarie, specialmente per le donne.
Uno dei promotori del progetto, Ganesh Ramakrishnan, responsabile del dipartimento di Ingegneria e Scienze informatiche dell’IIT Bombay, ha spiegato che Hanooman offrirà la possibilità di convertire la voce in testo, per andare incontro ai milioni di indiani che non sanno né leggere né scrivere, e in futuro verrà esteso alle lingue non contemplate nella release iniziale.