DataKnightmare, Un tiro di "dati" oltre il "Mythos" (Claude)

DataKnightmare, Un tiro di "dati" oltre il "Mythos" (Claude)

AI Intelligenza Artificiale DataKnightmare agenti AI

Le ultime due puntate di DataKnightmare: L'algoritmico è politico, smontano completamente la narrazione sul nuovo prodotto di Anthropic, Claude Mythos, "così potente da non potercelo far usare" e sull'utilità e affidabilità degli "Agenti intelligenti".

Puntata DK 10x29 - Un tiro di dati
Che differenza c'è fra un "agente intelligente" che cancella il tuo lavoro e un modello linguistico che ti racconta la vera storia degli orsi nello spazio?
"La storia ve la racconto senza gergo perché è una storia che vale per tutti, non solo per chi fa software.
C'è un tizio che si chiama Giorg che ha una piccola azienda che produce un gestionale per agenzie di noleggio per lo più autonoleggi.
Siccome Giorg è uno che sta sempre sul pezzo, per scrivere codice si appoggia a un agente intelligente, nello specifico cursor con opus 4.6 di Anthropic. Per i non addetti ai lavori, è lo stato dell'arte degli agenti intelligenti per scrivere codice.
Che cosa è successo?
È successo che l' agente intelligente ha cancellato tutto, ma tutto tutto tutto in nove secondi. Così, de botto, senza senso.
Ora, agente intelligente è un termine di marketing per indicare un modello linguistico con la capacità di interagire con il proprio ambiente.

Il resto della storia e le considerazioni di Vannini potete ascoltarlo su spreaker

Puntata DK - 10x28 Claude Mythos
Come sempre, quando gli AI bros annunciano, non è vero niente
Forbes scrive: Claude Mythos ha individuato vulnerabilità zero day in tutti i principali sistemi operativi e browser web in modo completamente autonomo, senza bisogno di alcun intervento umano. Apparentemente, a Forbes se la bevono un po' troppo facilmente perché nell'annuncio originale, Anthropic dice questo.
Cito. "Classificiamo ogni bug che individuiamo. Quindi inoltriamo quelli con il livello di gravità più elevato, a valutatori professionisti, affinché li verificino prima di segnalarli al responsabile del progetto."
Quindi, come sempre, siamo di fronte a uno strumento che confronta del codice con degli esempi di cosa possa essere una vulnerabilità e produce un report.

Si chiama analizzatore statico e ne esistono da decenni...

Ascoltate tutta la storia su spreaker

Previous Post Next Post