Tempo di lettura: quattro minuti. Leggibilità ***.
Dal sociale al veniale.
In un mio articolo precedente, ho fatto alcune riflessioni su come i nostri dati creino un mondo sospeso fra il reale ed il virtuale di cui abbiamo perso il controllo. In Internet abbiamo la chance di essere chi vogliamo, persino noi stessi. Scherzi a parte, noi generiamo dati come Pollicino, nella speranza di evitare di perderci, ma questi dati sono raccolti da altri e le aziende che li utilizzano tracciano profili di consumo, di credo politico e religioso, di speranze e di progetti per il futuro.
Le Major di Internet vivono dei nostri dati quindi delle nostre vite. Siamo noi la loro ricchezza. Ma vi siete mai chiesti quanto valgano questi dati?
Un caso su cui riflettere
Vi ricordate il caso Cambridge Analytica? L’azienda aveva acquisito dati di milioni di persone da Facebook (e questi furono un po’ tardivi a denunciarli) per fare previsioni e profilazioni non proprio ortodosse su eventi elettorali, così come aveva fatto fino a poco prima quando era una brillante azienda di studi di marketing. Ma un conto sono i fini commerciali, un conto quelli elettorali.
Lo scandalo è stato notevole e Cambridge Analytica è stata fatta fallire. Alcune domande: che fine hanno fatto quei dati? Visto che avevano un valore, quel valore è stato usato per coprire le perdite del fallimento? E quale valore?
E’ oramai da un po’ di tempo che il valore dei dati genera non più solo discussioni teoriche, ma genera voci di bilancio. Ma come si calcola il valore dei dati?
I dati: asset o servizio?
Chi si occupa di Data Governance o di Risk Management sa che i dati possono avere un valore. Il problema è come calcolarlo. Gli informatici non si sono mai posti questo problema e chi si occupa di Amministrazione e Finanza è alquanto perplesso sul tema della valorizzazione dei dati, almeno fino a che non vede transazioni economiche che li traccino.
Eppure i dati valgono: un approccio alla valorizzazione dei dati è quello di assumere il loro valore quale derivante da un acquisto da un Provider.
Se compro dei dati posso pensare ad un costo ammortizzabile, se compro anche un servizio di evoluzione sarà il costo di un servizio. Se i dati sono endogeni posso iscriverli fra i beni dell’azienda.
Contesto semantico, il moltiplicatore del valore
Possiamo comprare dei dati “crudi” ovvero dati che registrano fatti o semplici dati anagrafici. Ben altra spesa è comprare dati che hanno un più esteso contesto semantico e magari un formato di presentation (p.es. schede, studi) poiché aggiungere valore ai dati crudi ha un costo.
Facciamo un esempio. Se io dico “Ho fatturato 5 milioni di Euro”, ho descritto un fatto molto semplice. E’ molto facile mal interpretarlo. Allora aggiungo un’altra informazione: “Lo scorso anno ho fatturato 7 milioni, quest’anno 5”. Ora la situazione è meno rosea, ma è meglio non sbilanciarsi. Aggiungo: “I miei competitor fatturano in media 20 milioni Euro”. Tende al peggio. Ma non disperate: “Lo scorso anno il risultato netto è stato negativo. Quest’anno è positivo”.
A questo punto la narrazione del contesto dice che la mia azienda sarà pure piccolina, però almeno fa utili che è il vero mantra dell’economia.
Passare dai dati crudi a dati ricchi di contesto semantico costa molto: avere un report meditato ed interpretato sui vostri competitor costa molto di più che i loro crudi dati di bilancio. Lapalissiano.
E costa anche se fate questo processo al vostro interno: il passaggio dai sistemi gestionali (ERP, Enterprise Resource Planning) ai sistemi di Business Intelligence (Data Warehouse, Big Data, Analytics) è uno dei grandi business dell’informatica moderna. Ed è così che i dati acquisiscono valore, non fosse altro per gli investimenti che vi avete profuso.
La catena del valore dei dati, beni un po’ particolari
Il passaggio dai dati crudi a quelli che danno conoscenza (dati in ambito predittivo, analitico …) sviluppa una vera e propria catena del valore. Ogni passaggio di arricchimento semantico (aggiunta di contesto di business) o di qualità intrinseca (completezza, coerenza, veridicità …) ha un costo (hardware, software, servizi professionali) che si somma a quelli precedenti.
La catena del valore ha un costo determinabile ed è un’ulterioreragione per cui i dati hanno un valore reale e possono quindi essere messi a bilancio anche se non necessariamente saranno venduti a qualcuno. Una tesi finanziariamente ardita? Non credo,anche se rappresentano un patrimonio però un po’ particolare: non si consumano però hanno un ciclo di vita basato sulla rilevanzainformativa e quindi basato su un valore. I dati non sono una barra di ferro che compro, forgio, la rivendo e non la possiedo più. Possiamo copiare in modo fraudolento i dati e magari nessuno se ne accorge. Un dato può essere usato e venduto quante volte si vuole.
Valore determinato o stima?
Se non si può calcolare il valore oppure non si è in grado di calcolare l’incremento dovuto alla catena del valore, si può ipotizzare una stima del valore (chi ha valorizzato i dati simili ai nostri?) per poi verificarla e renderla più precisa nel tempo, anche calcolando i costi della catena del valore.
Calcolato o stimato, il valore è la base per arrivare ad una classificazione / profilazione dei dati e quindi ad una gestione coerente di questi asset per mantenere / incrementare il loro valore (sicurezza, qualità, accesso).
La classificazione ed il valore (stimato o meno) dei dati sono elementi fondamentali sia per la Data Governance sia per la Risk Analysis: non si può governare in modo “piatto” i dati dando lo stesso valore a tutti, così come il rischio (di perdita, furto, alterazione fraudolenta …) non è lo stesso per tutti, così come non produce gli stessi danni.
Alla base della classificazione le normative impongono comportamenti virtuosi che costano. La lista delle normative a cui il settore Finance deve essere compliant (e che riguardano i dati) è in costante crescita: avere dei dati compliant è ulteriore valore.
E gli informatici?
Il sistema informativo è il luogo ove accade tutto ciò. Il contesto semantico è dato dall’approfondimento di informazioni di contorno: dati endogeni, temporali (serie storiche), dati di mercato etc.
Il ruolo dei Data Modeler (ovvero chi si occupa di modellare le basi di dati) è cruciale per stabilire le prime “sinapsi” fra i dati e creare contesto per ulteriori integrazioni ed approfondimenti. Un buon modello dei dati deve dare una coerente rappresentazione della realtà ed essere pronto ad estendersi man mano che questa evolve. Anche un buon modello dati dà valore poiché rappresenta la comprensione del contesto.
Una buona analisi del contesto è fondamentale per creare la base per ulteriori “sinapsi” ed è compito degli analisti creare e mantenere con gli utenti questo contesto.
Gli informatici sono quindi solo i custodi di questo tesoro: operano in base a quanto espresso dalla Governance e non in base a criteri eminentemente tecnologici. Il loro contributo ed il loro supporto sono essenziali per passare da un potenziale economico ad una realtà economica.
Articolo molto esaustivo che fornisce, in modo piano e facilmente comprensibile, una chiave di lettura sul possibile utilizzo delle tante informazioni disponibili al fine di una analisi statica e dinamica di realtà complesse.