Come fa il cervello a prendere decisioni? Dipende ‘solo’ dai neuroni

La risposta è nell’indagine sui circuiti cerebrali fatta dai ricercatori di Harvard (Usa). Come funziona l’apprendimento secondo questa teoria rivoluzionaria

di MARINA SANTIN
28 febbraio 2025
Come fa il cervello a prendere decisioni?

Come fa il cervello a prendere decisioni?

Ogni giorno, il nostro cervello prende migliaia di decisioni, e ogni scelta – da quelle meno importanti, come preferire un ristorante a un altro, a quelle più significative, come optare per una carriera diversa o trasferirsi in una nuova città – porta a un risultato o a delle conseguenze che possono essere positive o negative. Come fa il cervello, durante il processo decisionale, a valutare rischi e benefici?

Un nuovo studio sui circuiti neuronali – condotto da ricercatori della ‘Harvard Medical School’ e dell'Università di Harvard e pubblicato sulla rivista Nature – ha portato a una scoperta interessante. Ecco quali.

L’indagine sui circuiti cerebrali

Per indagare i circuiti cerebrali che supportano le decisioni basate sulla ricompensa, i ricercatori hanno inserito in alcuni esperimenti sui topi dei concetti di ‘machine learning’ e hanno scoperto l’esistenza di due gruppi differenti di neuroni: uno che aiuta i topi a riconoscere risultati superiori alla media, l’altro associato a risultati inferiori alla media.

Queste cellule consentono quindi al cervello di valutare l'intera gamma delle possibili ricompense associate a una scelta. "I risultati del nostro studio - spiega Jan Drugowitsch, co-autore senior della ricerca e professore associato di neurobiologia presso l'Istituto Blavatnik della Harvard Medical School - suggeriscono che i topi e, per estensione, gli altri mammiferi, sembrano avere una modalità per valutare rischio e ricompensa più precisa e dettagliata di quanto si è pensato fino a oggi”.

Se confermati anche negli esseri umani, questi risultati potrebbero permettere di comprendere meglio come il nostro cervello prende decisioni basate sulla ricompensa e cosa succede alla capacità di giudicare rischi e benefici quando i circuiti di ricompensa falliscono.  

Le teorie tradizionali: un esempio  concreto

I neuroscienziati sono da tempo interessati a come il cervello utilizza le esperienze passate per prendere nuove decisioni. Tuttavia, secondo Drugowitsch, molte teorie tradizionali non riescono a cogliere la complessità e le sfumature del comportamento dell’uomo nel mondo reale.

Per spiegare questa sua affermazione Drugowitsch usa un esempio che comporta la scelta di un ristorante. Se si vuole andare sul sicuro potremmo sceglierne uno con un menu che l'esperienza ci dice essere affidabile e buono. Se al contrario, vogliamo rischiare, potremmo optare per uno che propone un mix di piatti, alcuni eccezionali, altri scadenti. I ristoranti differiscono notevolmente nell’offerta, ma le teorie neuroscientifiche esistenti li considerano equivalenti se calcolati in media, e quindi prevedono che abbiano la stessa probabilità di essere scelti.

"Sappiamo che non è così che agiscono gli esseri umani e gli animali – sottolinea il ricercatore – possiamo infatti decidere se correre rischio o andare sul sicuro. Come ricercatori, abbiamo la sensazione che dietro una scelta o decisione ci sia qualcosa di più della semplice ricompensa”.  

La teoria dell’apprendimento automatico  

Negli ultimi anni, i ricercatori nel campo del machine learning, l’apprendimento automatico - il cui compito è addestrare i computer a imparare dai dati e a migliorare con l’esperienza anziché essere programmati per farlo - hanno sviluppato una teoria del processo decisionale che cattura meglio l'intera gamma delle potenziali ricompense legate a una scelta e l’hanno incorporata in un nuovo algoritmo di apprendimento automatico.

“Fondamentalmente - afferma Drugowitsch - si sono domandati cosa succede se, invece di imparare esclusivamente i premi medi associati a determinate azioni, l'algoritmo impara tutta la gamma delle ricompense, e hanno visto che le prestazioni sono migliorate in modo significativo".

In un articolo pubblicato sempre su Nature nel 2020, Naoshige Uchida, professore di biologia molecolare e cellulare presso l'Università di Harvard, ha analizzato assieme ai suoi colleghi i dati esistenti per verificare se questa teoria dell’apprendimento automatico potesse essere applicata alle neuroscienze, in particolare nel processo decisionale del cervello dei roditori. “L’analisi ha mostrato che nei topi, l’attività del neurotrasmettitore dopamina - che svolge un ruolo fondamentale nella ricerca della ricompensa, nel piacere e nella motivazione - corrispondeva ai segnali di apprendimento della ricompensa predetti dall’algoritmo.  

Neuroni “ottimisti” e “pessimisti”  

In questo nuovo studio, Drugowitsch ha collaborato con Uchida per compiere un ulteriore passo avanti nella ricerca. Insieme, hanno progettato esperimenti sui topi per vedere come si svolge questo processo in una regione del cervello chiamata striato ventrale, che memorizza informazioni sulle possibili ricompense associate a una decisione.

"L'attività della dopamina fornisce solo il segnale di apprendimento per le ricompense attese, ma noi volevamo trovare rappresentazioni di queste ricompense apprese direttamente nel cervello", spiega Drugowitsch. I ricercatori hanno così addestrato i topi ad associare odori diversi a ricompense di varia entità, ovvero gli hanno insegnato l’intera gamma di possibili premi legati a una loro scelta. Successivamente, hanno riproposto ai topi gli odori e hanno osservato il loro comportamento di leccamento (i topi leccano di più in previsione di ricompense migliori) mentre registravano l'attività neurale nello striato ventrale. 

Il team ha identificato nel loro cervello due gruppi distinti di neuroni: uno che aiuta il topo a riconoscere risultati migliori del previsto e uno legato a risultati peggiori delle attese che, suggerisce Drugowitsch, “potremmo rappresentare come se avessimo nel cervello un neurone ottimista e uno pessimista ed entrambi ti danno consigli su cosa fare”. Quando i ricercatori hanno messo a tacere i neuroni “ottimisti”, il topo ha mostrato un comportamento che suggeriva che prevedesse una ricompensa meno allettante. Al contrario, quando sono stati silenziati i neuroni “pessimisti”, il topo si è comportato come se si aspettasse un premio di valore superiore.

"Questi due gruppi di neuroni lavorano assieme per formare una rappresentazione della gamma completa delle potenziali ricompense in seguito a una decisione", puntualizza Drugowitsch.  

Le applicazioni sull’essere umano

I ricercatori sono convinti che i risultati del loro studio possano trovare molte applicazioni. Drugowitsch infatti, ritiene che - sebbene siano necessarie ulteriori ricerche per confermare la validità dei risultati sugli uomini e adattarli alla complessità del processo decisionale umano - sulla base dei parallelismi tra il cervello dei topi e quello umano, possano già fare luce su come gli uomini valutano il rischio nelle decisioni e sul perché le persone con determinate condizioni come la depressione o la dipendenza possono avere difficoltà nel prendere decisioni.