Mi sono imbattatuto in una inchiesta di qualche anno fa, ma tutt'ora attuale ed esemplificativa dell'importanza dei metadati.
La ricerca è di ShareLab, dal nome "Metadata Investigation : Inside Hacking Team" e prende spunto da un furto (un leak) di dati operato a danno di Hacking Team, un'azienda italiana tra le maggiori produttrici e rivenditrici di armi informatiche del mondo. In particolare sono stati la ricerca prende in esame le email dell'azienda.
Una volta online, ogni nostro movimento, ogni clic, ogni e-mail inviata o ricevuta, ogni nostra attività produce una grande quantità di tracce invisibili. Queste tracce, una volta raccolte, messe insieme e analizzate, possono rivelare i nostri modelli comportamentali, la nostra posizione, i nostri contatti, le nostre abitudini e i nostri interessi più intimi. Spesso rivelano molto più di quanto ci sentiamo di condividere.
La maggior parte di queste tracce è nascosta nei metadati, cioè in piccole informazioni memorizzate nei pacchetti IP, nelle intestazioni delle e-mail o nei file creati. La ricerca mostra quante informazioni si possano dedurre analizzando e mettedo in relazioni i metadati senza necessità di accedere ai dati veri e propri. Nel caso specifico senza accedere al contenuto delle email.
Potete leggere l'intera inchiesta nel sito di ShareLab
oppure guardare il video riassuntivo che è sufficiente ad inquadrare la questione.
Nella puntata del 4 aprile. Un excursus dell'uso dei metadati all'interno del Web per "descrivere" in maniera comprensibile alle macchine il contenuto di una certa pagina. Vediamo che agli albori questo è molto incoraggiato, con l'uso del tag html "keywords" fondamentale per la nascita dei motori di ricerca. Man mano, il sistema appare pieno di difetti, e si passa a deprecare questo metodo, in funzione dell'estrazione automatica del contenuto. Negli ultimi anni però avviene un'inversione di tendenza: le grandi aziende informatiche rilanciano l'uso dei metadati. Infatti queste basano i loro profitti sui contenuti generati dagli utenti; più questi contenuti sono analizzabili in maniera profonda, più possono sviluppare modi di farci soldi sopra. Ecco quindi che alcune tecnologie vengono create (o alimentate) a uso e consumo dei social network o dei motori di ricerca. Sono tecnicamente aperte, sì - nel senso che sono standard aperti, implementabili da chiunque - ma sono dirette ad un fine specifico.
Notizie varie: