Mag 252017
 

Dati che individualmente non hanno valore, ma che insieme ad altri costituiscono una nuova miniera, con maggiore valore di quelle di oro. Non sono solo i dati privati di ogni singola persona, ma le attività di ciascun individuo, quando fa un acquisto o quando esprime un’opinione nell’ambito di un commento nei social network.

Con i big data è possibile ottenere le preferenze politiche, religiose, sessuali e alimentari, così come la situazione economica, sanitaria, di sicurezza e anche emozionale di ogni persona.

Un gruppo di ricercatori di Amnesty International ha rivelato l’offerta di una di queste imprese, Exact Data, sui dati di 1,8 milioni di musulmani per 138.380 dollari (126.851 euro), cioè 7,5 centesimi di dollaro (7 centesimi di euro) per persona. Questa compagnia, “presume di avere una base di dati di 200 milioni di contatti in Usa che possono essere filtrati attraverso 450 categorie, tra cui religione ed etnia”, dice la ricerca che ha pubblicato sul proprio web. Questo sito, ExactaData.com, offre anche “un ventaglio di liste di contatti preconfigurati”, per esempio, quelli di “statunitensi ispanici non assimilati” (a differenza di quelli che sono integrati nella società Usa, indipendentemente dalla loro condizione legale).

Molte delle imprese che vivono dalla vendita di dati privati di persone, non si nascondono in Internet.
Il fatto che si possano commercializzare queste liste e possano finire in mani indesiderate, fa sì che sia possibile che si usino per iniziative che possano colpire i diritti umani, come la creazione di sofisticati profili che possano rappresentare una minaccia alla privacy”, dice il direttore della comunicazione di Amnesty International Spagna, Miguel Angel Calderon.

Sanno molto di te, ma tu non sai nè che hanno i tuoi dati nè il nome di queste imprese.

Apr 102017
 

Nel mondo di oggi, qualsiasi processo decisionale, in ogni settore, qualsiasi innovazione, è data driven, cioè determinata dall’elaborazione di dati.

Ma chi sono i “padroni dei dati”? Gli addetti ai lavori li indicano con la sigla OTT, che significa Over The Top, ovvero “sopra la vetta”. Sei grandi aziende, sei “sorelle” che in diversi modi influiscono sulla società globalizzata. Sono chiamate così forse ricordando le “sette sorelle” che avevano lo stesso potere in un mondo passato, quello dell’industrializzazione del secondo dopoguerra. Allora il bene primario per lo sviluppo era il petrolio, oggi sono i dati. I dati sono il petrolio del nostro tempo.

Ci sono divergenze di vedute su quante e quali siano le sei (o sette) sorelle del Grande Fratello. L’elenco più comune comprende Google, Yahoo, Apple, Amazon, Facebook e Microsoft, tutte americane. La settima sarebbe Alibaba, cinese, che però è orientata più al commercio all’ingrosso che alla vendita ai consumatori.

Alla luce di queste semplici considerazioni, l’idea che siamo tutti spiati non è esagerata,  non è frutto di paranoia né punto di partenza per qualche scoop estemporaneo. E’ una realtà con cui tutti dobbiamo fare i conti.
“Tutti” vuol dire proprio “tutti”, escluso solo qualche eremita o qualche anziano signore o signora che delle tecnologie non sa che farsene. “Tutti” che non prendono le precauzioni minime per evitare di essere spiati, profilati, limitati nella loro libertà di scegliere.

La CIA, secondo Wikileaks, può spiarci attraverso il televisore intelligente. Che assomiglia sempre di più all’orwelliano teleschermo di “1984”. E anche attraverso il frigorifero intelligente, capace di ricordarci che dobbiamo comperare le uova.
Ma è così difficile aprire lo sportello e contare le uova rimaste?

Forse qualcuno vuole spostare l’intelligenza (per quel po’ che ne abbiamo) dalla nostra testa alle cose che dobbiamo comperare. Così, sempre più stupidi, compreremo molte più cose. Cose più intelligenti di come saremo noi, felici di possederle.

Nov 282016
 

Vi siete mai chiesti quanti dati una società potrebbe raccogliere su di voi con niente di più che un nome e un “mi piace” su Facebook?

Nell’esperimento – che è stato condiviso dalla società di prevenzione delle frodi Cifas – una caffetteria mostra esattamente cosa succede quando ottiene dai suoi clienti un like alla sua pagina di Facebook per un caffè gratuito. Richiedendo anche il loro nome sono in grado di raccogliere rapidamente una quantità spaventosa di dati personali nel tempo necessario per preparare un cappuccino. Le informazioni, che sono cercate da alcune persone in un furgone dall’altra parte della strada, vengono sussurrate nell’orecchio del barista del caffè. Si va dall’istruzione al posto di lavoro e la religione. Chiaramente maggiori sono le informazioni messe su Facebook più sarà semplice essere frodati. Condividere dati personali come data di nascita, indirizzo e numero di telefono può rendere vulnerabili.

fonte: lastampa.it

Gen 142015
 

Grazie ai ‘mi piace‘ che seminiamo sui social network, i computer riescono a inquadrare la nostra personalità molto meglio di quanto non facciano amici e parenti: gli unici in grado di batterli (ma di misura) sono i nostri partner.

E’ quanto emerge dall’analisi condotta su oltre 86.000 profili Facebook dai ricercatori delle università di Cambridge e Stanford. Lo studio, pubblicato sulla rivista dell’Accademia americana delle scienze (Pnas), fornisce elementi utili per elaborare nuove strategie di interazione uomo-macchina, in modo da sviluppare computer capaci di riconoscere le emozioni umane proprio come nei film di fantascienza.

Le ‘chiavi’ per entrare nella nostra psiche, del resto, le forniamo noi stessi ogni volta che clicchiamo ‘mi piace’: grazie alle impronte che lasciamo sui social network come Facebook, i computer sanno dipingere un quadro della nostra personalità che risulta essere addirittura più fedele di quello tratteggiato dalle persone in carne e ossa che ci conoscono davvero. I risultati dello studio sono impietosi. Bastano 10 ‘mi piace’ perchè il computer riesca a inquadrare la nostra personalità meglio di un collega di lavoro, 70 ‘mi piace’ per battere un nostro coinquilino e 150 per superare un nostro familiare. Contro il partner, la lotta si fa più dura: il computer deve analizzare almeno 300 ‘mi piace’ per eguagliare la perspicacia e l’esperienza della nostra dolce metà.

”L’abilità di giudicare la personalità è parte essenziale della nostra vita sociale, nelle decisioni di tutti i giorni come nei progetti a lungo termine, come quando dobbiamo scegliere chi sposare, chi assumere o chi eleggere come presidente”, spiega uno dei ricercatori, David Stillwell. Il ‘Grande Fratello’ delle emozioni potrà dunque esserci di aiuto nel fare le nostre scelte, a patto però che ”i consumatori, gli sviluppatori di tecnologie e i decisori politici promuovano tecnologie e leggi a protezione della privacy, dando agli utenti pieno controllo delle loro impronte digitali”, concludono i ricercatori.

fonte: http://www.ansa.it/sito/notizie/tecnologia/internet_social/2015/01/13/il-computer-ci-conosce-meglio-di-amici-e-parenti-_35583654-66f7-4ec6-b2a0-07bcfad544cf.html

ndr: il titolo originale dell’articolo era “Il computer ci conosce meglio di amici e parenti “, che ritengo improprio perchè di per sè il computer non ci conosce affatto, ma è la solita accoppiata big data e data mining che fa la differenza. E Facebook ha in mano un “modesto” archivio di informazioni con le quali divertirsi!

 

Feb 102013
 

Il problema della privacy in rete, come spiegato più volte (a partire dalla semplice associazione big data + data mining), è davvero preoccupante.
Il mercato non sta a guardare e viene incontro a noi cittadini con nuovi servizi (a pagamento, ovviamente), per tutelare e proteggere la nostra privacy.

Un esempio è quello offerto da Reputation.com: guarda il video

from: MyPrivacy from Reputation.com

Tutto verosimile quanto illustrato nella prima parte: ma poi, davvero è possibile ripulire la nostra “fedina digitale”? Qualche dubbio mi rimane: andando a visitare il sito reputation.com, mi sono visto “attaccare” da ben 14 trackers (da Google a Yahoo, ma anche ClickTale, AdRoll, Quantcast, etc.)

Se il controllore è a sua volta controllato…

Ott 032012
 

Ho introdotto due nuovi (relativamente…) neologismi, già trattati nei precedenti articoli: Big Data e Data Mining.
Vorrei chiarire cosa sottintendono. Per ora parliamo di Big data.

<<Nel 2003 avevamo prodotto collettivamente 5 miliardi di gigabyte di dati (o exabyte). L’anno scorso questa cifra è salita a 1,8 trilioni di gigabyte (o zettabyte). Si tratta di dati prodotti dagli acquisti e dalle vendite, dai cellulari, dai nostri spostamenti (es. il telepass), dagli oltre 30 milioni di sensori istallati in città (quelli per la misurazione delle polveri sottili) o incorporati in oggetti (macchine industriali, automobili, contatori elettrici, ecc..), dalle attività svolte online.

Pensate che ogni minuto in rete vengono spedite 204 milioni di email,effettuate 2 milioni di ricerche su Google, caricate l’equivalente di 48 ore di video su YouTube, creati più di 27mila post su Tumblr e WordPress, inviati oltre 100mila tweete compiute oltre 2.2 milioni di azioni su Facebook (like, condivisioni, commenti, ecc…).

Big data è il termine che viene usato ultimamente per far riferimento a base dati che hanno alcune caratteristiche peculiari, le 3 V:

  • Volume: nel senso di ingenti quantitativi di data set non gestibili con i database tradizionali;
  • Velocity: dati che affluiscono e necessitano di essere processati a ritmi sostenuti o in tempo reale. La velocità a volte è un fattore critico per garantire la soddisfazione del cliente;
  • Variety: elementi di diversa natura e non strutturati come testi, audio, video, flussi di click, segnali provenienti da RFID, cellulari, sensori, transazioni commerciali di vario genere.

Una miniera di informazioni a disposizione delle organizzazioni che saranno in grado di acquisirli, gestirli, interpretarli. Le aziende potrebbero utilizzarli per analizzare i rischi e le opportunità di mercato, ma soprattutto per comprendere più a fondo i bisogni dei clienti, addirittura prima che questi li esprimano. Wal-Mart ha acquisito una società specializzata per monitorare i post su Facebook, Twitter, Foursquare e individuare i punti vendita da rifornire adeguatamente dei prodotti più citati.

Anche le pubbliche amministrazioni potrebbero trarre vantaggio dalla comprensione dei dati a loro disposizione. Ad esempio l’agenzia per il lavoro tedesca analizzando i dati storici sull’impiego e sugli investimenti effettuati, è riuscita a segmentare la popolazione dei disoccupati per offrire interventi mirati ed efficienti. Ciò si è tradotto in un risparmio di 10 miliardi di euro all’anno e nella riduzione del tempo impiegato per ottenere un lavoro.

Ma per ottenere questi vantaggi c’è bisogno di tecnologie sofisticate e un cambiamento culturale non indifferente. Infatti tutti questi bit sono inutili senza un investimento in risorse umane competenti che sappiano come trasformarli in informazioni utili. Il lavoro del data scientist è uno di quelli che nei prossimi anni sarà sempre più richiesto. Secondo McKinsey, nei soli Stati Uniti per poter sfruttare efficacemente le potenzialità dei big data occorrerebbero un milione e mezzo di analisti e data manager. Se le grandi organizzazioni imparano ad unire i punti delle nostre esistenze per i propri fini commerciali quali problemi potrebbero sorgere? Chi ci dice che non cedano alla tentazione di mettere in atto analisi predittive arbitrarie e discriminatorie per alcune categorie sociali?

Nella società dei dati dove la conoscenza asimmetrica, tra aziende e individui, può acuire enormemente il divario sociale, la gestione dei big data dovrebbe essere affrontata come una questione che coinvolge i diritti civili di tutti. C’è bisogno di stabilire, per tempo, nuove regole in termini di privacy, controllo e conservazione dei dati, trasparenza delle analisi, sicurezza. Alcune riflessioni e proposte in tal senso le trovate nel mio ultimo ebook che si intitola proprio “La società dei dati“.>>

Articolo scritto da Vincenzo Cosenza, Ottobre 2012

Ago 102012
 

Il “social data mining” si occupa di analisi di informazioni generate dai social network.

Recentemente, Twitter ha siglato un accordo con la società inglese DataSift, la quale avrà accesso a ricerche (collegate a metadati, ovvero informazioni su luoghi, lingue, ecc.)  fino 24 mesi nel passato, per scandagliare le discussioni su un prodotto, gli umori della gente durante un avvenimento, e molto altro (per avere un’idea delle possibilità, consiglio di leggere il bel romanzo di Jeffery Deaver,  “La finestra rotta”).
Basti pensare che lo spazio occupato dai messaggi inviati su Twitter negli ultimi due anni è pari a 22mila dvd da 4,5GB.

Ritorniamo al discordo del “big data”: un’attività che muoverà, entro la fine dell’anno, 5 miliardi di dollari e, nelle previsioni tra 5 anni, ben oltre 53 miliardi di dollari, cioè 10 volte tanto rispetto il 2012.

Feb 292012
 

Partiamo dal recente caso Apple: una app (Path), presente (ora rimossa) nell’iTunes App Store, leggeva i contenuti della rubrica del dispositivo (iPhone o iPad) in cui era installata, a insaputa dell’ignaro utente. Tutte le rubriche “rubate”, venivano memorizzate in un server remoto.
Di chi era il server? Quasi di tutti: si è scoperto che ad archiviare i dati di Apple erano Twitter, Facebook, Instagram, Foursquare, a pure Google.
Al di fuori di qualsiasi controllo, sui questi server sono state archiviate decine di milioni di nominativi e relativi numeri telefonici presi dalle rubriche degli smartphone, con annesse relazioni: chi è amico di chi, quanti volte si sono chiamati, per quanto tempo.
Cosa significa questo? Che i dati sono la nuova valuta di questo millennio. Le informazioni digitali, archiviate e aggregate, costituiscono una risorsa preziosissima per chi vuol fare business su di noi, tant’è che le migliori università si stanno organizzando per istituire dei corsi sulla Data Science, ovvero una nuova scienza che insegna ad analizzare e utilizzare questi dati. I nostri dati.
Pensate che il 93% dei dipendenti Microsoft è membro di LinkedIn e che Microsoft, accedendo a queste informazioni, controlla i suoi dipendenti: sa chi non è soddisfatto dell’attuale lavoro e ne sta cercando un altro, chi si lamenta e per quale motivo.
Oppure al caso Nike Plus: la scarpa da corsa “intelligente” che registra con un sensore i percorsi e i ritmi di chi le indossa, comunicando tutto in rete, all’interno di una banca dati “dedicata” ai runners, i quali possono confrontarsi e comunicare esperienze. Ma c’è sempre il rovescio della megaglia. Ad esempio, Nike sa anche, per le grando città, quali sono i percorsi preferiti, e dove solitamente sostano i corridori. Pensate che queste informazioni farebbero gola a catene di bar, articoli sportivi, ecc.? Chi ci assicura che Nike tiene riservate queste informazioni?