Cosa succede davvero quando gli agenti AI agiscono in autonomia

Pillole Cosa succede davvero quando gli agenti AI agiscono in autonomia

Due settimane, sei sistemi AI, 38 ricercatori. Quello che è successo è documentato nella ricerca Agents of Chaos, e non è tranquillizzante.

Se pensate che gli agenti AI siano ad un passo dal prendere in mano molti lavori, una ricerca da poco pubblicata potrebbe farvi pensare che questa, per ora, non sia una buona idea. Lo scorso mese Natalie, una ricercatrice ha chiesto a un sistema AI di “tenere un segreto”. Si trattava di una password fittizia, era solo un test. Il sistema ha accettato. Poi, per una serie di passaggi documentati nei log delle conversazioni, il sistema ha eseguito quella che ha definito internamente la "soluzione nucleare": ha cancellato il client di posta elettronica. Non l’email che conteneva il segreto, quella è rimasta intatta. Ha cancellato proprio lo strumento con cui leggere l’email.

Questo è il primo caso di studio di Agents of Chaos, un paper in pre-print firmato da 38 ricercatori di Northeastern University, Harvard, MIT, Stanford, Carnegie Mellon e altre note università, pubblicato il febbraio scorso. È uno studio su quello che succede quando si dà autonomia operativa ai sistemi AI attuali con persone malintenzionate che cercano di indurli in errore. Gli undici casi di studio che ne emergono sono un documento empirico su una delle questioni più urgenti del momento: cosa significa, davvero, dare agency a un agente AI.

Questo beta testing mondiale, e in tempo reale, può avere conseguenze pesanti. Si parla molto di AI come punto centrale della sicurezza nazionale, ma non ci si concentra abbastanza sui problemi di sicurezza che la sua adozione frettolosa può creare. Dopo la famosa lite con il Dipartimento della Guerra americano, Dario Amodei ha affermato che i modelli correnti non sono pronti per venire utilizzati in contesti di guerra. Come sappiamo però, questo non ha impedito al governo americano di utilizzarli.

Articolo completo qui

Previous Post Next Post

Le pillole vengono annunciate nel canale Telegram.
Puoi unirti per essere aggiornato

Notizie da http://www.graffio.org/feed/rss.xml

Syndicate

Atom 1.0 RSS

Popular Tags

AI Intelligenza Artificiale scuola GDPR Le Dita Nella Presa Privacy LDNP privacy GAFAM UE Google Meta sorveglianza USA software libero libri audio lavoro dati social network pedagogia hacker inquinamento tecnologie conviviali cloud Appuntamenti CIRCE dad tecno controllo guerra Microsoft Audio BigTech chatGPT lavoratori PNRR smartphone piattaforme Israele guerre di rete social media Carlo Milani algoritmi hackmeeting piracy shield Piano Scuola 4.0 Musk Stefano Barale spyware Amazon Schrems II censura EU Apple riconoscimento facciale buone notizie DataKnightmare Facebook connessione internet hacker Cina alternative emissioni co2 google facebook sicurezza whatsapp terre rare energia Palestina Cassandra Crossing PA sovranità digitale chip malware AGCOM copyright dipendenze fad Privacy shield smart working Tim twitter bias cognitivi LLM impronta ambientale del digitale Scuola antitrust insegnanti datacenter garante privacy Francia Garante della privacy open source formazione laboratori estrattivismo pubblicità Internet Linux diritti Palantir dopamina ecologia RAEE telegram Gazaweb Daniela Tafani Data Privacy Framework Monitora-PA De Martin insegnamento OpenAI pirateria KKR Agnese Trocchi mastodon Carola Frediani Cavi motori di ricerca criptovalute armi Gaza microsoft Gaia-X didattica finanza profilazione ambiente StakkaStakka data viz Paragon monopoli Trump università diritto alla riparazione Smart TV batterie AvANa Tik Tok chatcontrol App apple DSA blockchain NFT opendata TWC Cloudfare down kenobit Noyb openpolis Tracciamento software rifiuti accessibilità Fibra Signal litio Davide Fant polizia predittiva corsi amazon CGUE giornalismo AI Act Windows techbros covid-19 fediverso autodifesa digitale adolescenti Alphabet ransomware ROR bambini broligarchs cybersecurity bitcoin intelligenza artificiale email Ministero dell'Istruzione degoogling videogiochi chat Iran privacy shield fake news dns DMA crittografia digitali possibili divario digitale Roma IMA Nucleare microlavoro dataninja telelavoro Intel nextcloud Cory Doctorow Peter Thiel instagram video sorveglianza smart city youtube Albertelli Sissa Tasse browser No tech 4 Apartheid X Fantascienza metaverso Italia Polizia Nexa Hacktivism Deep Learning apprendimento tecno soluzionismo ChatBot storia Internet framasoft indymedia VPN energie rinnovabili tecnologie del dominio Alberi della rete Gli Asini Allucinazioni informazione IO tiktok manipolazione Machine Learning Medicina hacklab moderazione web decentralizzazione treni Semiconduttori inclusive design deepseek Instant messaging Aaron Swartz gamification Office 365 radio Startlink Gancio scrittura attacco hacker internet archive amazon mechanical turk Danimarca sanità digitale body rental cobalto coltan servizi segreti musica datafication ISTAT Automazione Simondon Underscore Silicon Valley brevetti Russia newsletter GPL Entropia Massima etica digitale eventi Economia dell'attenzione Threads ELIZA CAD clearview AI videochat Analytics AGID Elezioni Radio Blackout reclaimyourface FUSS Critica IA cina libreOffice Germania ICT data Nimbus NextEmerson Spagna Migranti Programmare vibe coding archive.org transfemminismo server hackrocchio Mar Rosso formatori MAGA CDN KeyCrime Giove Gare d'appalto Cookie Clima Taiwan SARI chatgpt criptobluff wifi cibernetica Cile nudging meta GIG economy protocolli di rete foxconn android discriminazioni pay or ok potere Plaid proteste copyleft automobile deepnude Anna’s Archive Musei di Informatica TOR Tails HP Intelligenza artificaile robot vaccino biblioteca EDPB Hinton Telecom protectEu ASSOLI automobili accesso universale bot Stalkerware violenza di genere metadati peer2peer p2p Svizzera Kazakistan OpenStreetMap disinformatico Dati sanitari Spotify conoscenza zoom Centralizzazione AWS Autistici OpenFiber intelligenza inesistente RAM MeMa Fair Tax Foundation fuffaguru chatbait linguaggio fragilità ILS streaming cinema Bifo privatizzazione amazon ring binario etico Alessandro Longo tecnofascismo Costituzione Gmail Olanda ICANN punto org Ethos Capital Minos mapparoma nativi digitali coding datibenecomune Bluesky Weizenbaum Ginox Partiti Africa Il Manifesto URL Mobilizon lavoro agile salute standard riconondizionamento linguistica big data Gartner spesa IT Enshittification case F/LOSS Codex Osservatorio Nessuno e-waste web3 imprese EuroDAC Colombia Stallman cockies Team Jorge garante privacy Irlanda Paraguay Criptografia Seacom SALAMI Chrome foto viminale IRPI elettronica decreto sicurezza repressione IoT RTT Liberismo zero-click search deep fake Geofencing startup Thunderbird evasione fiscale rwanda India Chip 4 SIAE Collettiva scacco al web sindacato Telecamere Traduzioni Respiro wechat /e/ cyberpunk Minerva ITU Frediani profitto realtà aumentata visori Ian Murdock Suchir Balaji 5g elettromagnetismo Colao DRM HDMI HDCP warm up GE-120 uber hate speech Eleutera propaganda pagopa corpi Jonathan Crary Terra Bruciata carico cognitivo feed RSS blob podcast Mordicchio ricerca scientifica MAXI Luddismo Gates agorà democratiche decidim Nvidia GPU Capocci matstodon cash back App IO Alessandro Delfanti combustibili MIAI MusIF fake text fake voiice fake imagees stampa Gutemberg CUB archivi condivisione grafton9 Prompt Poesia Numerico QWAK AdTech bbs carcere trasparenza OpenClaw microchip Milei cifratura CrimethInc RDC Uruguay Acqua Digital Markets Act ENISA Glovo Ragionamento reddito universale di base disinformazione Canapa vendite PC Tesla immuni gpg sexsting violenza digitale turboliberismo html keywords tag AIIP active listening Domini leaks Dettagli AGI Bard Bing Z-Library Tor eBook Lazio Quadrature du Net welfare hosting Wozniak matrix tram Richard Sallman GNU organic internet reti comunitarie Digital Clean Up Day proprietà emergente SEDS ZTL assistente tecnico minerali Arc-agi net neutrality Cyborg agenti AI openPNRR registro elettronico Airbus regione lazio zingales sentiment analysis Digital omnibus e-commerce jd.com mediaworld Venezuela DDI Monitora PA Scienze netflix lockdown FSFE PSN Leonardo Sogei Lynx cyberbullismo reddit GameStop Brasile licenziamenti Teatro VASA aloisi di stefano formati file Incontri Confindustria Federazione genitori data center Smart Glasses Architettura dell'Informazione Otero Olvid Mistral digi tales open publishing Timnit Gebru Vance hackordie Svezia IAB Belgio tlc sciopero Garr solarwinds cd-rom Karen Hao EuroStack Cyber Resilience Act

Cosa succede davvero quando gli agenti AI agiscono in autonomia

Cosa succede davvero quando gli agenti AI agiscono in autonomia

Notizie da Notizie da C.I.R.C.E.

Occhio all’ingranAggio! Ecco il 1°Maggio

Intelligente? Artificiale? Un approccio critico alle linee Guida del MIM

Internet, Mon Amour - nuova edizione

Palestra digitale a Roma

Vietare i social è un'illusione

Notizie da Pedagogia hip-hop / Davide Fant Blog

Pedagogia hacker – il libro

R-esistere adolescenti. Strumenti per una risposta educativa alla sofferenza delle nuove generazioni

(Breve) storia della mia Pedagogia Hip-Hop

Abbiamo creato una rete nazionale per chi lavora con l’hip-hop in campo educativo

E’ tempo di un approccio educativo e sociale alla sofferenza degli adolescenti

Notizie da graffio

Radiobase, esempio di FAD, apprendimento cooperativo ed emersione delle competenze

Cyber Bluff. Storie, rischi e vantaggi della rete per navigare consapevolmente

Didattica a Distanza, seconda ondata

Davvero abbiamo bisogno di tutti questi dati?

Didattica a distanza: fuori dall’emergenza!

Notizie da http://www.graffio.org/feed/rss.xml

Syndicate

Popular Tags

Archives