“Avvelenare” un LLM è più facile del previsto: bastano 250 documenti malevoli

“Avvelenare” un LLM è più facile del previsto: bastano 250 documenti malevoli

AI Intelligenza Artificiale manipolazione

Avvelenare un modello linguistico non richiede accesso ai suoi pesi: basta saturare il web di contenuti calibrati. Il caso Clock Tower X documenta questa strategia e solleva questioni urgenti su trasparenza, regolamentazione e responsabilità epistemica nell’era dell’intelligenza artificiale generativa.

L’avvelenamento sistematico dei modelli linguistici di grandi dimensioni – LLM poisoning – non è più una minaccia teorica confinata ai laboratori di cybersecurity. È diventato oggetto di un contratto governativo, finanziato con fondi pubblici esteri, progettato per alterare le risposte che milioni di utenti ricevono ogni giorno da sistemi come ChatGPT. Il caso che lo dimostra arriva da un filing ufficiale depositato presso il Dipartimento di Giustizia degli Stati Uniti.

Indice degli argomenti

  • Il contratto da 6 milioni di dollari che vuole riscrivere la “conoscenza” dell’AI
  • Le tre tecniche per avvelenare un modello linguistico
    • Data poisoning: il veleno nel corpus di addestramento
    • RAG poisoning: l’attacco al momento dell’interrogazione
    • Generative Engine Optimization (GEO): la SEO per l’era dell’AI
  • Il paradosso della delega: perché gli agenti AI non sono oracoli
  • Verso un ecosistema informativo resiliente: le contromisure possibili
    • Contromisure tecniche
    • Contromisure istituzionali
    • La sfida culturale: il vero terreno di battaglia
  • Conclusione: la responsabilità epistemica resta umana

Leggi l'articolo

Previous Post Next Post