68 Minuti al Giorno a Ri-Spiegare il Codice? C'è una Soluzione

Il context rot è reale — il tuo agente IA deriva dopo 30 turni, e paghi la tassa di compattazione ogni ora. auto-memory dà a GitHub Copilot CLI un richiamo chirurgico senza bruciare migliaia di token.

Questo post è stato tradotto automaticamente. Per la versione originale, clicca qui.

Conosci quel momento in cui la tua sessione di Copilot raggiunge /compact e l’agente dimentica completamente su cosa stavi lavorando? Passi i successivi cinque minuti a ri-spiegare la struttura dei file, il test fallito, i tre approcci già provati. Poi succede di nuovo.

Desi Villanueva l’ha cronometrato: 68 minuti al giorno — solo per il riorientamento. Non scrivendo codice. Non rivedendo PR. Solo aggiornando l’IA su cose che già sapeva.

La Bugia della Finestra di Contesto

Il tuo agente arriva con un numero grande sulla scatola. 200K token. Sembra massiccio. In pratica è un soffitto, non una garanzia.

La matematica reale: circa 125K prima di digitare una parola, e il limite effettivo è 45K token prima che la qualità degrade — a causa del problema “lost in the middle” degli LLM.

La Tassa di Compattazione

La parte crudele: la memoria esiste già. Copilot CLI scrive ogni sessione in un database SQLite locale in ~/.copilot/session-store.db. L’agente semplicemente non può leggerlo.

auto-memory: Uno Strato di Richiamo, Non un Sistema di Memoria

pip install auto-memory

~1.900 righe di Python. Zero dipendenze. Installato in 30 secondi.

50 token invece di 10.000 — accesso chirurgico ai file che hai toccato ieri, non un diluvio di risultati grep irrilevanti.

Conclusione

Il context rot è un vero vincolo architetturale. auto-memory lo aggira dando al tuo agente un meccanismo di richiamo economico e preciso.

Dai un’occhiata: auto-memory su GitHub. Post originale di Desi Villanueva: I Wasted 68 Minutes a Day.