Bignami, concetti base degli LLM (parte seconda)

Pillole Bignami, concetti base degli LLM (parte seconda)

Seconda parte del bignamino di Quatrociocchi sugli LLM spiegati senza supercazzole.

Un LLM non è un pensatore profondo: è un sistema statistico addestrato su enormi quantità di testo per modellare le regolarità del linguaggio, senza accesso diretto al mondo reale. Tutto quello che fa è empiricamente descrivibile e riproducibile: nessuna magia, nessun “spirito” emergente.

Riporto di seguito i concetti. L'originale si può leggere su Linkedin

Embedding

I computer non capiscono parole, elaborano numeri. Per questo ogni parola viene trasformata in un elenco di numeri chiamato vettore. Se due parole compaiono spesso nello stesso contesto (“gatto” e “cane”), i loro vettori saranno vicini; se non compaiono mai insieme (“gatto” e “trattore”), saranno lontani. È una mappa statistica, non un dizionario di significati. Nessun concetto, solo distanze in uno spazio di numeri.

Tokenizzazione

Il modello non legge il testo come facciamo noi. Spezza le frasi in piccoli pezzi chiamati token. A volte una parola è un token intero, altre volte viene spezzata: “incredibile” può diventare “in”, “credi”, “bile”. Il modello lavora solo con questi pezzi, non con concetti o frasi intere. Non c’è un “pensiero” sotto: solo pezzi da ricomporre.

Positional Encoding –

Perché l’ordine delle parole non si perda, a ogni token viene aggiunta un’informazione sulla sua posizione nella frase. È così che il modello distingue tra “l’uomo morde il cane” e “il cane morde l’uomo”. Non è grammatica: è solo un trucco matematico per non confondere l’ordine. Coordinate, non regole sintattiche.

Fine-tuning e RLHF

Dopo l’addestramento di base, il modello viene “educato” con dati più mirati o con istruzioni di esseri umani (RLHF = Reinforcement Learning with Human Feedback). Qui gli umani dicono: “questa risposta va bene, questa no”. È così che il modello impara a rispondere in modo più chiaro e cortese, ma resta statistica, non personalità. Premi e punizioni, non comprensione.

Prosegue...

Context window

Un modello non ricorda all’infinito. Ha una “finestra di contesto” che stabilisce quante parole può considerare alla volta. Se è troppo piccola, dimentica l’inizio della conversazione. Oggi i modelli più avanzati hanno finestre molto ampie e possono “tenere a mente” testi enormi in un’unica volta. Ma sempre con memoria a breve termine: finita la finestra, sparisce tutto.

Prompt engineering

Dare istruzioni chiare migliora le risposte. Non perché il modello “capisca”, ma perché guidi meglio la scelta delle parole. Domanda confusa = risposta confusa. Niente magia: solo input più mirati.

Decoding

Dopo aver calcolato la probabilità di ogni parola possibile, il modello deve sceglierne una.

Greedy decoding: Prende sempre quella più probabile → testo corretto ma noioso.
Sampling: pesca a caso seguendo le probabilità → più varietà, ma rischia di dire sciocchezze.
Beam search: valuta più frasi in parallelo e sceglie la migliore → più lento ma di qualità. Non c’è ispirazione: solo diverse strategie di scelta.

Temperature e top-k

Sono le “manopole dello stile”.

Temperature regola la creatività: bassa = frasi prevedibili, alta = frasi fantasiose (a volte troppo).
Top-k dice al modello: “considera solo le k parole più probabili”.

Tutto qui: numeri, probabilità, un po’ di informatica. Tantissimi dati e tanta potenza di calcolo. Niente magia. Niente filosofia dei termosifoni.

Previous Post Next Post

Le pillole vengono annunciate nel canale Telegram.
Puoi unirti per essere aggiornato

Syndicate

Atom 1.0 RSS

Popular Tags

AI Intelligenza Artificiale scuola GDPR Le Dita Nella Presa privacy LDNP Privacy GAFAM UE Google sorveglianza audio software libero Meta social network inquinamento libri dati lavoro USA dad cloud pedagogia hacker Appuntamenti tecnologie conviviali CIRCE chatGPT PNRR Microsoft tecno controllo lavoratori guerre di rete Audio algoritmi Carlo Milani smartphone piattaforme guerra Musk Piano Scuola 4.0 Israele Schrems II spyware hackmeeting censura Stefano Barale piracy shield BigTech Apple riconoscimento facciale Facebook connessione internet buone notizie google facebook whatsapp emissioni co2 hacker alternative Amazon energia EU fad Privacy shield smart working copyright twitter Cassandra Crossing Tim DataKnightmare terre rare malware antitrust PA garante privacy insegnanti bias cognitivi Cina impronta ambientale del digitale formazione open source chip sicurezza Palestina RAEE AGCOM Garante della privacy sovranità digitale Internet estrattivismo telegram dopamina Monitora-PA ecologia Daniela Tafani Data Privacy Framework insegnamento motori di ricerca diritti Francia Carola Frediani Linux laboratori KKR OpenAI pirateria monopoli Gaia-X microsoft mastodon data viz criptovalute ambiente pubblicità Cavi LLM Gazaweb Trump opendata TWC rifiuti apple dipendenze accessibilità armi batterie software didattica profilazione Fibra Smart TV blockchain openpolis NFT DSA Signal Tracciamento Tik Tok diritto alla riparazione StakkaStakka Gaza De Martin Paragon social media covid-19 amazon polizia predittiva cybersecurity università AvANa bitcoin App Agnese Trocchi Windows litio AI Act Davide Fant CGUE bambini chatcontrol Alphabet corsi broligarchs ROR divario digitale instagram privacy shield microlavoro finanza giornalismo email intelligenza artificiale ransomware dataninja telelavoro degoogling DMA videogiochi datacenter Intel Noyb Ministero dell'Istruzione down Palantir techbros attacco hacker Cory Doctorow sanità digitale Roma body rental amazon mechanical turk Instant messaging gamification apprendimento dns smart city IO indymedia video sorveglianza browser fake news Aaron Swartz storia Internet nextcloud framasoft Gli Asini energie rinnovabili Cloudfare Office 365 Semiconduttori informazione Danimarca metaverso ChatBot chat Tasse Deep Learning Machine Learning cobalto Fantascienza Medicina Nexa Albertelli Allucinazioni internet archive crittografia decentralizzazione digitali possibili No tech 4 Apartheid Hacktivism Sissa Alberi della rete Startlink moderazione autodifesa digitale deepseek Gancio web Scuola deepnude foxconn coltan youtube cina radio brevetti videochat nudging clearview AI automobile metadati CAD vaccino GIG economy manipolazione OpenFiber GPL tecno soluzionismo Gare d'appalto Kazakistan datafication data inclusive design ISTAT reclaimyourface Centralizzazione robot Polizia protocolli di rete copyleft peer2peer p2p FUSS newsletter ICT discriminazioni formatori adolescenti meta NextEmerson Tails ASSOLI Automazione Simondon AGID EDPB TOR VPN Cile Hinton Dati sanitari criptobluff Analytics KeyCrime Giove android biblioteca accesso universale Russia Threads scrittura Musei di Informatica disinformatico Plaid treni Telecom Underscore ELIZA Autistici tiktok etica digitale pay or ok fediverso Intelligenza artificaile musica CDN HP wifi Mar Rosso servizi segreti Economia dell'attenzione X cibernetica Migranti libreOffice Germania Cookie potere archive.org Nucleare Entropia Massima Clima Silicon Valley AWS Stalkerware violenza di genere Radio Blackout Programmare protectEu solarwinds sentiment analysis immuni gpg bot aloisi di stefano datibenecomune rwanda trasparenza cyberpunk stampa Gutemberg amazon ring assistente tecnico mapparoma formati file sindacato zingales reddit GameStop viminale SARI IRPI DRM HDMI HDCP startup html keywords tag ICANN punto org Ethos Capital organic internet reti comunitarie netflix zoom lockdown standard Capocci nativi digitali pagopa cash back App IO Colao agorà democratiche decidim coding regione lazio AGI Codex open publishing IoT profitto SIAE lavoro agile Ginox cockies ricerca scientifica IAB Belgio wechat IMA Wozniak web3 hackrocchio Federazione automobili Chip 4 Partiti Elezioni imprese DDI Monitora PA Mobilizon hosting ITU ILS Z-Library Tor eBook CrimethInc Frediani chatgpt privatizzazione hate speech Team Jorge MAXI transfemminismo scacco al web Eleutera Osservatorio Nessuno Garr SALAMI realtà aumentata visori Digital Markets Act ENISA F/LOSS RDC riconondizionamento combustibili Timnit Gebru CUB proprietà emergente vendite PC Cyber Resilience Act Lazio Cyborg Gates SEDS Otero Numerico Bifo garante privacy Irlanda ZTL tlc sciopero MeMa Richard Sallman GNU /e/ podcast Mordicchio conoscenza Alessandro Delfanti Svezia fake text fake voiice fake imagees Alessandro Longo matrix cd-rom Traduzioni Respiro warm up GE-120 foto Domini leaks Dettagli proteste Collettiva linguistica big data corpi Jonathan Crary Terra Bruciata Minos tram Weizenbaum Olanda server Costituzione uber binario etico Confindustria openPNRR Geofencing Il Manifesto Lynx 5g elettromagnetismo digi tales propaganda RTT Mistral QWAK cifratura Bard Bing carcere Olvid Glovo elettronica OpenStreetMap streaming cinema licenziamenti Gartner spesa IT Quadrature du Net welfare Italia microchip salute PSN Leonardo Sogei reddito universale di base Seacom deep fake Tesla Nimbus Africa Digital Clean Up Day Spagna EuroDAC VASA Canapa bbs Minerva e-waste fragilità AdTech URL Paraguay Svizzera Scienze Critica IA Brasile Colombia case active listening minerali genitori Taiwan FSFE eventi Vance evasione fiscale hacklab Telecamere intelligenza inesistente Arc-agi net neutrality Ian Murdock Suchir Balaji Liberismo disinformazione sexsting tecnofascismo Milei EuroStack registro elettronico Incontri feed RSS blob Luddismo MIAI MusIF Ragionamento Architettura dell'Informazione cyberbullismo Spotify Gmail Fair Tax Foundation zero-click search decreto sicurezza repressione archivi condivisione grafton9 Karen Hao carico cognitivo linguaggio violenza digitale turboliberismo Bluesky e-commerce jd.com mediaworld vibe coding Chrome Criptografia Thunderbird

Bignami, concetti base degli LLM (parte seconda)

Bignami, concetti base degli LLM (parte seconda)

Embedding

Tokenizzazione

Positional Encoding –

Fine-tuning e RLHF

Context window

Prompt engineering

Decoding

Temperature e top-k

Notizie da Circe

Mini Digital Festival 2025

Laboratorio "Giocare o essere giocati" al Festival Interferenze Costruttive

Vietare i cellulari e promuovere l’Ia, l’insostenibile confusione al potere

Scuola e nuove linee guida: convegno nazionale CESP

Rena Summer School 2025

Notizie da Pedagogia Hip Hop

Pedagogia hacker – il libro

R-esistere adolescenti. Strumenti per una risposta educativa alla sofferenza delle nuove generazioni

(Breve) storia della mia Pedagogia Hip-Hop

Abbiamo creato una rete nazionale per chi lavora con l’hip-hop in campo educativo

E’ tempo di un approccio educativo e sociale alla sofferenza degli adolescenti

Notizie da graffio

Radiobase, esempio di FAD, apprendimento cooperativo ed emersione delle competenze

Cyber Bluff. Storie, rischi e vantaggi della rete per navigare consapevolmente

Didattica a Distanza, seconda ondata

Davvero abbiamo bisogno di tutti questi dati?

Didattica a distanza: fuori dall’emergenza!

Syndicate

Popular Tags

Archives