34/100 · Primitivo · Lobo temporale mediale (interno)

Ippocampo

Maturità AIPrimitivo34/100
absembpridevmatsup

Ippocampo

Dal cervello all'algoritmo. L'ippocampo è il modo in cui ti ricordi ieri. La controparte AI — retrieval-augmented generation, database vettoriali, finestre di contesto lunghe, tool di memoria per gli agenti — è un sostituto ingegneristico per una funzione che non sappiamo come far imparare.

Cosa fa la biologia

L'ippocampo è una piccola struttura ricurva, profonda nel lobo temporale mediale di ciascun emisfero. Svolge quattro compiti che, in combinazione, non hanno un buon analogo ingegneristico:

  1. Codifica rapida one-shot dei ricordi episodici — una singola conversazione, un singolo pomeriggio — in un codice sparse.
  2. Separazione e completamento di pattern che ti permettono di richiamare un'intera scena da uno spunto parziale senza collassare in una media generica.
  3. Consolidamento che, durante il sonno, rigioca le esperienze del giorno e le scrive lentamente nella neocorteccia come memoria semantica.
  4. Mappatura spaziale attraverso cellule di luogo, cellule di griglia e cellule di direzione — il tuo GPS interno.

I danni bilaterali producono l'amnesia più studiata della neuroscienza (il paziente H. M.): percezione intatta, linguaggio intatto, capacità di formare una nuova memoria a lungo termine distrutta.

Cosa abbiamo costruito

Nel 2026 non esiste una controparte AI dell'ippocampo che consolida l'esperienza dentro al modello. Tutto quello che abbiamo è esterno — e lo stack di workaround ingegneristici è ormai profondo dieci livelli.

  • 2016 — DeepMind Differentiable Neural Computer. Prima rete neurale seria con memoria esterna indirizzabile.
  • Mag 2020 — Retrieval-Augmented Generation. Lewis et al. introducono il pattern canonico: accoppia un modello linguistico congelato con un retriever appreso e uno store di documenti.
  • 2023 — Ecosistema vector DB. Pinecone, Weaviate, pgvector e Chroma trasformano la ricerca per similarità di embedding in una commodity.
  • Feb 2024 — Gemini 1.5. Google spedisce contesto 1M token — primo modello frontier alla scala del milione.
  • Mag 2024 — Mamba selective state-space. Arriva in produzione via Jamba di AI21.
  • 2024 — mem0, MemGPT, LangMem. Livelli di memoria esplicita negli agent framework; mem0 è il più adottato in open-source.
  • Set 2025 — Anthropic Memory tool in beta. Prima API di memoria persistente first-party — il Memory tool permette a Claude di leggere e scrivere uno store per utente tra un turno e l'altro.
  • Ott 2025 — ChatGPT memory. L'analogo OpenAI arriva un mese dopo.
  • Apr 2026 — Claude Opus 4.7 a 1M token. Claude Opus 4.7 tiene una monorepo da 750K righe o un libro da 1.500 pagine in un singolo prompt allo stesso prezzo dei 200K — e ancora non lo consolida nei pesi.
  • Feb 2026 — Gemini 3.1 Pro. Contesto 1M con output 65K token e retrieval sull'intera finestra.
  • 2026 — Ibridi Mamba-Transformer. IBM Granite 4.0 arriva con inferenza ~8× più rapida a memoria costante.

La ricetta architetturale è stata fissata in modo pulito nel paper RAG originale:

"Esploriamo una ricetta di fine-tuning general-purpose per la retrieval-augmented generation (RAG) — modelli che combinano memoria parametrica pre-addestrata e memoria non parametrica per la generazione del linguaggio. […] Troviamo che i modelli RAG generano linguaggio più specifico, vario e fattuale rispetto a una baseline seq2seq state-of-the-art puramente parametrica." — Lewis et al., 2020 (arXiv:2005.11401)

Cinque anni dopo, ogni primitiva di memoria nella lista qui sopra è una variazione sullo stesso tema: il modello resta congelato, il mondo vive in uno store esterno, il retriever sceglie cosa farci entrare. Lo Stanford AI Index 2026 segnala il gap esplicitamente: la capacità migliora ovunque tranne nel modo in cui i modelli si aggiornano dall'esperienza.

Cosa manca ancora

Il gap dell'ippocampo è il più grande di questo atlante.

  1. Oblio catastrofico. Il fine-tuning continuo degrada le capacità precedenti senza un'esposizione ripetuta esterna. Il cervello non paga questa tassa.
  2. Nessun analogo del consolidamento. I modelli non rigiocano le esperienze del giorno prima per riscriverle nei pesi durante il downtime. Ogni sessione riparte da zero sopra una conoscenza congelata.
  3. Nessun richiamo episodico. Gli agenti non ricordano in modo affidabile "cosa è successo nella sessione 47 tre mesi fa" senza uno store mantenuto a mano che il modello stesso non controlla.
  4. Costo memoria-come-contesto. Riempire la cronologia ogni turno scala con la lunghezza della conversazione; il conto cresce con l'utente.

Come leggiamo il verdetto

Diamo alla controparte AI il livello Primitivo. I sostituti ingegneristici sono utili e commercialmente importanti, ma l'architettura è qualitativamente diversa da un ippocampo. Chiudere questo gap cambierebbe cosa significa "un agente AI".

Esempi concreti

  • Anthropic Memory toolClaude legge e scrive su uno store per utente tra un turno e l'altro — prima primitiva di memoria production-grade.
  • Claude 4.7 contesto 1MTiene una monorepo da 750K righe o un libro da 1.500 pagine in un singolo prompt allo stesso prezzo dei 200K.
  • mem0 / MemGPTLivelli di memoria agente open-source — store cross-sessione con ricerca semantica e decay temporale.

Tappe

  • 2016DeepMind Differentiable Neural Computer — prima rete neurale con memoria esterna
  • Mag 2020Retrieval-Augmented Generation — Lewis et al. (arXiv:2005.11401)
  • 2023L'ecosistema vector DB matura (Pinecone, Weaviate, pgvector, Chroma)
  • Feb 2024Gemini 1.5 — contesto 1M token, primo modello frontier alla scala del milione
  • Mag 2024Mamba selective state-space arriva in produzione (Jamba di AI21)
  • 2024mem0, MemGPT, LangMem — livelli di memoria esplicita negli agent framework
  • Set 2025Anthropic Memory tool in beta — prima API di memoria persistente first-party
  • Ott 2025ChatGPT memory — l'analogo OpenAI arriva un mese dopo
  • Apr 2026Claude Opus 4.7 — 1M token in produzione, ancora episodico non consolidato
  • Feb 2026Gemini 3.1 Pro — contesto 1M con output 65K token, retrieval sull'intera finestra
  • 2026Ibridi Mamba-Transformer (IBM Granite 4.0) — inferenza 8× più rapida a memoria costante

Fonti

Voci Wikipedia correlate

Altre regioni