L'impatto dei modelli linguistici sull'ecosistema della condivisione della conoscenza
Un recente studio pubblicato su PNAS Nexus ha rivelato che l'adozione diffusa di modelli linguistici di grandi dimensioni (LLM), come ChatGPT, ha provocato un notevole calo nella condivisione della conoscenza pubblica su piattaforme come Stack Overflow. La ricerca ha evidenziato una riduzione del 25% dell'attività degli utenti sul noto sito di domande e risposte per programmatori, nei sei mesi successivi al lancio di ChatGPT, rispetto a piattaforme simili dove l'accesso a ChatGPT è limitato.
"Gli LLM sono estremamente potenti, hanno un valore elevato e influenzano profondamente il mondo. Ci si comincia a chiedere quale sarà il loro futuro," afferma Maria del Rio-Chanona, prima autrice dello studio e membro associato della facoltà presso il Complexity Science Hub (CSH).
La ricerca e le sue implicazioni
Del Rio-Chanona ha spiegato che lo studio ha ipotizzato che, invece di porre domande e ricevere risposte su piattaforme pubbliche come Stack Overflow, gli utenti stiano chiedendo informazioni in modo privato a ChatGPT. Tuttavia, i modelli come ChatGPT sono addestrati su dati pubblici, i quali vengono in parte sostituiti. "Cosa accadrà in futuro?" si chiede.
"Abbiamo notato una diminuzione delle domande e delle risposte su Stack Overflow dopo il lancio di ChatGPT. Questo ha implicazioni significative, poiché potrebbe non esserci abbastanza dati pubblici per addestrare i modelli in futuro," avverte Del Rio-Chanona. In questo studio, ha collaborato con Nadzeya Laurentsyeva dell'Università Ludwig Maximilian di Monaco e Johannes Wachs, membro della facoltà del CSH e professore all'Università Corvinus di Budapest.
L'importanza di Stack Overflow
Wachs sottolinea l'importanza di Stack Overflow, definendolo un database di conoscenza immensamente prezioso accessibile a chiunque abbia una connessione internet. "Le persone in tutto il mondo apprendono dalle domande e risposte pubblicate da altri," afferma.
In effetti, anche i modelli di intelligenza artificiale come ChatGPT si basano su contenuti generati dagli esseri umani, come i post di Stack Overflow. Ironia della sorte, la sostituzione della creazione di contenuti umani da parte dell'IA renderà più difficile l'addestramento di futuri modelli di IA. Utilizzare dati generati dall'IA per addestrare nuovi modelli è generalmente considerato inefficace, un processo paragonato a fare una fotocopia di una fotocopia.
Un cambiamento significativo
Le scoperte dello studio vanno oltre i cambiamenti tecnologici, toccando il tessuto delle strutture economiche e sociali. Gli utenti potrebbero diventare meno propensi a contribuire a piattaforme di conoscenza aperta mentre interagiscono di più con LLM come ChatGPT, portando a un trasferimento di dati preziosi da repository pubblici a sistemi di IA di proprietà privata, spiegano Del Rio-Chanona e i suoi colleghi.
"Questo rappresenta un cambiamento significativo della conoscenza dai domini pubblici a quelli privati," sostengono i ricercatori. Secondo loro, ciò potrebbe anche approfondire il vantaggio competitivo dei pionieri nell'IA, concentrando ulteriormente la conoscenza e il potere economico.
Un impatto su tutti gli utenti
Del Rio-Chanona e i suoi collaboratori hanno scoperto che il calo nella creazione di contenuti su Stack Overflow ha colpito utenti di tutti i livelli di esperienza, dai principianti agli esperti. Hanno anche osservato che la qualità dei post non è diminuita significativamente, secondo il feedback degli utenti, indicando che sia i contributi di bassa che di alta qualità vengono sostituiti dagli LLM.
Inoltre, lo studio ha mostrato che l'attività di pubblicazione in alcuni linguaggi di programmazione, come Python e Javascript, è diminuita in modo significativamente maggiore rispetto alla media della piattaforma. "I risultati suggeriscono che le persone stanno effettivamente ponendo domande su Python e Javascript, due dei linguaggi di programmazione più utilizzati, a ChatGPT piuttosto che a Stack Overflow," conclude Del Rio-Chanona.