Big data
Per Big Data ( o Megadati ) si intende la grande quantità di dati che ogni momento viene generata dall'utilizzo dei dispositivi elettronici come smartphone, computer, dispositivi hardware della domotica e dell'Internet of Things.
Perché si chiama Big Data? Si usa l'aggettivo "Big" perché il flusso dei dati è veramente enorme. Nel 2019 si stima una massa di dati di circa 30-35 Zettabytes, dieci volte più del 2010. E nei prossimi anni la IoT farà crescere in modo esponenziale il volume dei dati. Per dare un'idea del volume... 1 Zettabyte equivale a 250 miliardi di dvd.
E' evidente che questo enorme flusso di dati è una grande fonte di informazioni utili per le attività marketing.
Ogni dispositivo fornisce dei dati sul comportamento, lo stile di vita e i bisogni di una persona.
Tuttavia, oggi il volume dei dati è generato con una velocità tale che diventa veramente difficile elaborare tutto.
Molti dati non sono acquisiti, altri sono registrati ma non elaborati. Pertanto, non producono alcuna informazione utile.
Nota. Uno degli scopi della scienza dei dati è trasformare il dato in un'informazione utile. Di recente si ricorre alle tecniche di data mining e machine learning ma non solo. E' anche importante lo storage e la velocità di accesso ai dati. Il campo di studio è molto vasto.
Le caratteristiche dei big data
Le principali caratteristiche dei big data sono sintetizzate dalle "3V" di Douglas Laney:
- Volume. E' la quantità di dati che viene generata ogni secondo. Di anno in anno è in forte crescita.
- Varietà. La tipologia dei dati non è omogenea. In particolar modo, esistono due grandi categorie: dati strutturati o non strutturati. Inoltre, i dati sono generati da sorgenti molto diverse tra loro (social network, pc, IoT, ecc. ).
- Velocità. E' la velocità con cui i nuovi dati sono generati da tutte le sorgenti in ogni parte del mondo.
Nel tempo sono state aggiunte altre caratteristiche come la veridicità e il valore che indicano l'affidabilità dei dati e la loro importanza, ossia la qualità e l'utilità dei dati.
Le differenze tra Big Data Management e Analytics
Il ciclo di vita dei big data è suddiviso in due aree:
- Big Data Management. E' l'insieme dei processi di generazione/acquisizione, preparazione e memorizzazione dei dati.
- Big Data Analytics. E' l'insieme dei processi che analizzano le informazioni contenute dei dati per interpretare la realtà ( descriptive analytics ), predire gli eventi futuri ( predictive analytics ) o prendere decisioni ( prescriptive analytics ).