Ippocampo
Dal cervello all'algoritmo. L'ippocampo è il modo in cui ti ricordi ieri. La controparte AI — retrieval-augmented generation, database vettoriali, finestre di contesto lunghe, tool di memoria per gli agenti — è un sostituto ingegneristico per una funzione che non sappiamo come far imparare.
Cosa fa la biologia
L'ippocampo è una piccola struttura ricurva, profonda nel lobo temporale mediale di ciascun emisfero. Svolge quattro compiti che, in combinazione, non hanno un buon analogo ingegneristico:
- Codifica rapida one-shot dei ricordi episodici — una singola conversazione, un singolo pomeriggio — in un codice sparse.
- Separazione e completamento di pattern che ti permettono di richiamare un'intera scena da uno spunto parziale senza collassare in una media generica.
- Consolidamento che, durante il sonno, rigioca le esperienze del giorno e le scrive lentamente nella neocorteccia come memoria semantica.
- Mappatura spaziale attraverso cellule di luogo, cellule di griglia e cellule di direzione — il tuo GPS interno.
I danni bilaterali producono l'amnesia più studiata della neuroscienza (il paziente H. M.): percezione intatta, linguaggio intatto, capacità di formare una nuova memoria a lungo termine distrutta.
Cosa abbiamo costruito
Nel 2026 non esiste una controparte AI dell'ippocampo che consolida l'esperienza dentro al modello. Tutto quello che abbiamo è esterno — e lo stack di workaround ingegneristici è ormai profondo dieci livelli.
- 2016 — DeepMind Differentiable Neural Computer. Prima rete neurale seria con memoria esterna indirizzabile.
- Mag 2020 — Retrieval-Augmented Generation. Lewis et al. introducono il pattern canonico: accoppia un modello linguistico congelato con un retriever appreso e uno store di documenti.
- 2023 — Ecosistema vector DB. Pinecone, Weaviate, pgvector e Chroma trasformano la ricerca per similarità di embedding in una commodity.
- Feb 2024 — Gemini 1.5. Google spedisce contesto 1M token — primo modello frontier alla scala del milione.
- Mag 2024 — Mamba selective state-space. Arriva in produzione via Jamba di AI21.
- 2024 — mem0, MemGPT, LangMem. Livelli di memoria esplicita negli agent framework; mem0 è il più adottato in open-source.
- Set 2025 — Anthropic Memory tool in beta. Prima API di memoria persistente first-party — il Memory tool permette a Claude di leggere e scrivere uno store per utente tra un turno e l'altro.
- Ott 2025 — ChatGPT memory. L'analogo OpenAI arriva un mese dopo.
- Apr 2026 — Claude Opus 4.7 a 1M token. Claude Opus 4.7 tiene una monorepo da 750K righe o un libro da 1.500 pagine in un singolo prompt allo stesso prezzo dei 200K — e ancora non lo consolida nei pesi.
- Feb 2026 — Gemini 3.1 Pro. Contesto 1M con output 65K token e retrieval sull'intera finestra.
- 2026 — Ibridi Mamba-Transformer. IBM Granite 4.0 arriva con inferenza ~8× più rapida a memoria costante.
La ricetta architetturale è stata fissata in modo pulito nel paper RAG originale:
"Esploriamo una ricetta di fine-tuning general-purpose per la retrieval-augmented generation (RAG) — modelli che combinano memoria parametrica pre-addestrata e memoria non parametrica per la generazione del linguaggio. […] Troviamo che i modelli RAG generano linguaggio più specifico, vario e fattuale rispetto a una baseline seq2seq state-of-the-art puramente parametrica." — Lewis et al., 2020 (arXiv:2005.11401)
Cinque anni dopo, ogni primitiva di memoria nella lista qui sopra è una variazione sullo stesso tema: il modello resta congelato, il mondo vive in uno store esterno, il retriever sceglie cosa farci entrare. Lo Stanford AI Index 2026 segnala il gap esplicitamente: la capacità migliora ovunque tranne nel modo in cui i modelli si aggiornano dall'esperienza.
Cosa manca ancora
Il gap dell'ippocampo è il più grande di questo atlante.
- Oblio catastrofico. Il fine-tuning continuo degrada le capacità precedenti senza un'esposizione ripetuta esterna. Il cervello non paga questa tassa.
- Nessun analogo del consolidamento. I modelli non rigiocano le esperienze del giorno prima per riscriverle nei pesi durante il downtime. Ogni sessione riparte da zero sopra una conoscenza congelata.
- Nessun richiamo episodico. Gli agenti non ricordano in modo affidabile "cosa è successo nella sessione 47 tre mesi fa" senza uno store mantenuto a mano che il modello stesso non controlla.
- Costo memoria-come-contesto. Riempire la cronologia ogni turno scala con la lunghezza della conversazione; il conto cresce con l'utente.
Come leggiamo il verdetto
Diamo alla controparte AI il livello Primitivo. I sostituti ingegneristici sono utili e commercialmente importanti, ma l'architettura è qualitativamente diversa da un ippocampo. Chiudere questo gap cambierebbe cosa significa "un agente AI".