

Discover more from All About Data
Dati e Software: più che petrolio... vino! È l'invecchiamento che fa la differenza
Somiglianze e differenze tra mondo dei dati e mondo applicativo
Original in Italian; automatic translation into English available here.
Intro
La dialettica tra IT e Business è un grande classico che contraddistingue qualsiasi azienda, a prescindere dal settore.
Negli ultimi 10 anni, grazie ad una accresciuta comprensione di quelli che sono veramente gli asset di un’impresa e ad una serie di articoli di successo (tra cui quello che ha lanciato il ruolo sexy del data scientist), il mondo dei Dati1 è stato promosso a terzo incomodo con (quasi) pari dignità.

Tanto si è scritto (e anche ottimi libri 😉), ma a mio avviso resta una certa difficoltà, da parte dei non addetti ai lavori, nel mettere a fuoco alcuni aspetti fondamentali che rendono i Dati profondamente diversi sia dall’IT tradizionale che dal Business.
Anche perché quello che si è cercato di fare, a livello organizzativo, è stato associare chi si occupa di dati ad uno dei due pesi massimi (IT o Business): nella mia esperienza sono ancora poche le grandi aziende che hanno creato un Chief Data Officer a diretto riporto del CEO, preferendo invece posizionarlo a riporto del CIO oppure di figure apicali di business.
Non parlerò oggi di modelli organizzativi, ma mi focalizzerò sul primo caso, che tra l’altro vivo in prima persona a livello professionale: la collocazione del mondo Dati all’interno dell’IT. Penso che sia una scelta valida (con pro e contro come qualsiasi cosa), ma vedo uno sbilanciamento enorme: sono molto chiari gli aspetti che uniscono Dati e IT (in particolare applicazioni / software), un po’ meno gli aspetti che li distinguono.
Figli dell’innovazione
Per chi non ha una formazione tecnica, l’affinità tra mondo applicativo / software e il mondo dei dati è lampante.
Sia sviluppare software che lavorare con i dati richiede un alto livello di competenza tecnica e di propensione all’innovazione tecnologica. Lo si vede dal fatto che, sia con i dati che con il software, quello che si fa oggi era impensabile 10 anni fa… anzi, anche 2 anni fa.

Che si parli di Cloud o dei container, degli ultimi linguaggi di programmazione o di database non relazionali, o ancora di deep learning e dell’immancabile generative AI, stare al passo con le evoluzioni (o rivoluzioni) nel mondo del software e in quello dei dati ha un aspetto in comune - è difficile!
Si tende però a fare un po’ di confusione tra i dati in senso stretto e gli algoritmi e i software per manipolarli, generarli, interrogarli. Sono proprio i dati, inteso come contenuto informativo e rappresentazione in bit di una qualche realtà, ad essere profondamente diversi dal software.
Dati e software sono entrambi come il vino, ma…
Chi non ha sentito dire che “i dati sono il nuovo petrolio”? È una metafora tanto intrigante quanto grossolana; io, per parlare di dati e di software, e soprattutto per spiegarne la differenza principale, preferisco fare riferimento al vino.
Poco importa la qualità di partenza, quello che è fondamentale è cosa succede con l’invecchiamento: un aspetto critico anche per capire le caratteristiche delle data-companies rispetto alle software-companies.

Software: invecchia diventando aceto
Partiamo dal mondo applicativo. Il software tipicamente… invecchia male. È chiarissimo per chi ci lavora, e i motivi sono tanti. Tre sono i primi che mi vengono in mente:
I linguaggi di programmazione e i framework evolvono e migliorano col tempo… un applicativo scritto in un linguaggio vetusto generalmente è costruito su basi meno solide e/o con meno funzionalità di uno moderno
I giovani sviluppatori preferiscono ovviamente acquisire competenze sulle tecnologie più nuove, e può diventare molto difficile fare manutenzione di software vecchio per carenza di personale con skill non più attuali2
Per quanto sia complesso, non c’è nulla di unico o impossibile da riprodurre in un software (con l’opportuno investimento in tempo e persone)
Quindi anche un software eccellente può diventare facilmente aceto.
Imparando dai migliori in questo (le Big Tech americane), non è un caso che software e framework vengano dismessi in pochi anni a favore di versioni aggiornate: non si vuole rimanere con prodotti legacy che diventano rapidamente una liability - aspetto che molte aziende italiane devono ancora capire.
Per fare un esempio concreto, prenderò un servizio di successo di AWS (Amazon Web Services): Glue 2.0, introdotto ad agosto 2020 e per cui termina il supporto a gennaio 2024, nemmeno tre anni e mezzo dopo l’introduzione. Considerando che da quella data non vengono più garantiti i livelli di servizio (SLA) e che chi usa quei servizi deve organizzarsi per migrazioni e adeguamenti con un po’ di margine, il tempo effettivo di vita di quel software è veramente limitato… ed è giusto così.
L’alternativa è fare come lo struzzo: lasciare andare avanti un software sperando che non ci siano problemi, ma correre il rischio di avere disservizi clamorosi e dover avviare progetti complessi ed esosi di migrazione e aggiornamento massivo3.
Queste caratteristiche dell’invecchiamento del software hanno una ovvia conseguenza sulle aziende che ne fanno il cuore del proprio business: l’assenza di una forte e intrinseca barriera all’ingresso. Anzi, un competitor agile, veloce e senza dipendenze da software legacy ha sicuramente un grande vantaggio rispetto ad un’azienda consolidata che si trova giocoforza a gestire una stratificazione di applicazioni di epoche differenti.
Dati: invecchiano acquisendo valore
I dati sono qualcosa di completamente diverso.
Richiedono persone, processi, competenza e soprattutto tempo per essere raccolti ed elaborati, ma una volta acquisiti rappresentano tipicamente un asset non riproducibile e un vantaggio strategico il cui valore si vede nel tempo.
Chi lavora con le serie storiche lo sa benissimo: avere una metodologia stabile e una profondità temporale ragguardevole (in alcuni casi, pluridecennale) è fondamentale per fare analisi sensate, così come per applicare gli algoritmi più evoluti di AI o simili.
E poco importa se si affaccia sul mercato un competitor con fondi illimitati: se arriva in ritardo di anni, non potrà mai colmare quel gap di dati che non ha avuto modo di raccogliere rispetto ad un incumbent.
I dati, se ben conservati, acquisiscono valore come un vino d’annata.
Questo crea un ulteriore sfida per un Chief Data Officer o Head of Data*4 di spessore: se si riesce a guardare oltre al singolo progetto o alla prossima trimestrale, si può in realtà generare un asset di cui la propria azienda potrà ottenere i dividendi a lungo termine.
L’esempio per eccellenza è Google: dietro l’apparenza di software-company, si può vedere chiaramente una visione da data-company, in cui ogni prodotto (dalle email, alle mappe, agli smartphone) contribuisce a creare un data asset unico su ciascuno di noi.
Quei dati che sono alla base dell’advertisement che genera l’80% dei ricavi di Alphabet (la holding di Google).
Conclusioni
Mi sembrano passati secoli da quando la buzzword del momento era Big Data.
Di strada ne è stata fatta nel dare al mondo dei Dati l’importanza che merita, eppure alcuni aspetti sono ancora un po’ fraintesi. Siamo affascinati dal software più evoluto (io per primo!), ma è utile rendersi conto che mettere risorse nelle mani giuste per generare e gestire dati è un ottimo investimento, in grado di pagare grossi dividendi a lungo termine!
Chi lo ha capito sono alcune aziende, presenti in Europa ma più radicate oltreoceano, che hanno costruito sui dati dei business solidissimi, spesso lontano dalle prime pagine dei giornali.
Parlo di data-companies come Reuters, Equifax e Duns & Bradstreet, che esistono dal 1800, come ricorda l’amico
.Sì, aziende nate non solo prima degli smartphone, di internet o dei PC… ma prima della diffusione dell'energia elettrica! E sul mercato tuttora, dopo due secoli.
Elon Musk direbbe: let that sink in!
In cui includo anche algoritmi ed intelligenza artificiale (classica e generativa).
Oppure lavorare su software datato può essere visto come una frustrazione per un giovane professionista
Per chi legge questo articolo da una prospettiva 100% business: è per questo che un software non raggiunge mai la versione final in cui si può pensare che funzioni e basta… a costo zero!
Da leggere come “Head of Data [qualcosa]”, ad esempio Head of Data Science. oppure Head of Data Analytics o Data Architecture. La versione con l’asterisco mostra l’eleganza di una sintassi concisa come quella di SQL!
Dati e Software: più che petrolio... vino! È l'invecchiamento che fa la differenza
Mi permetto di offrire una visione parzialmente diversa, i dati non sono sempre come il vino, come le applicazioni non sono sempre come l’aceto.
Con il tempo anche i dati possono tendere a diventare aceto anziché vino.
La mia tesi si basa su due semplici fenomeni: l’obsolescenza e l’irrilevanza dei dati.
I dati possano diventare obsoleti e irrilevanti se non sono aggiornati o mantenuti in modo adeguato. Ad esempio, i dati sulle preferenze dei consumatori, le tendenze del mercato, le condizioni ambientali o le normative legali possono cambiare rapidamente e richiedere una revisione o una sostituzione dei dati esistenti. Se i dati non riflettono la realtà attuale, possono portare a decisioni errate o inefficaci. Un esempio di obsolescenza dei dati si può trovare nel settore turistico, dove le informazioni sui luoghi da visitare, le attrazioni da vedere, i ristoranti da provare o le recensioni da consultare possono variare di giorno in giorno a seconda della stagione, degli eventi e dipendere da molti altri fattori. Se un’azienda turistica si basa su dati non aggiornati per offrire i suoi servizi ai clienti, potrebbe perdere competitività e reputazione.