Capita spesso che i dati a cui ci connettiamo siano estremamente disordinati e sporchi. Con le operazioni di ETL, Extraction, Transformation, Loading, noi vogliamo andare a risolvere tutti questi problemi. Tableau offre Tableau Prep, per effettuare questo tipo di operazioni. Tableau Prep si divide in due prodotti principali: Tableau Prep Builder e Tableau Prep Conductor; in questa lezione noi analizzeremo soprattutto il Tableau Prep Builder, e poi daremo qualche cenno anche del Conductor. Tableau Prep si inserisce prima di Tableau Desktop, oppure direttamente prima di Tableau Server. In pratica noi andremo a pulire e dare una forma ai nostri dati utilizzando il solito approccio Tableau, ovvero il Drag & Drop. Costruiremo un flusso grafico composto da vari step, che vedremo nel dettaglio, e alla fine potremo generare, a partire da questo flusso, più output. Gli output possono essere delle data source locali, quindi per esempio un file Excel o un CSV, oppure potremo pubblicare direttamente su Tableau Server o Tableau Online. Partiremo come al solito da un'introduzione allo strumento e quindi a tutte le sue interfacce e a tutte le possibilità , poi andremo ad analizzare tutti gli step, che sono quei passettini che compongono il flusso finale. Il primo che vedremo è l'Input Step. Con l'Input Step, ovviamente, andremo a connetterci a fonti dati anche di tipo differente, come facevamo con Tableau Desktop. Poi vedremo il Cleaning Step: questo è lo step centrale, perché possiamo andare ad eseguire una serie di operazioni di pulizia che potevamo eseguire in parte anche con Tableau Desktop, quindi ad esempio, se noi abbiamo dei dati duplicati, possiamo andare a rimuoverli, oppure potremo creare anche dei campi calcolati o aggiungere dei filtri, oppure fare proprio una pulizia dei dati, immaginate, ad esempio, di avere una colonna con nome e cognome, scritti però in maniera un po' fantasiosa, ad esempio alcune volte con nome e cognome con la lettera maiuscola, altre volte il nome minuscolo e il cognome maiuscolo, oppure con l'inserimento di spazi, un po' in maniera random. Con il Cleaning Step noi potremmo andare a risolvere tutti questi problemi. Poi andremo a vedere quello che si chiama Pivot Step. Questo step serve quando vogliamo trasformare i dati da colonna a riga e viceversa, immaginate per esempio di avere una tabella in cui abbiamo i clienti sulle righe, e poi abbiamo una colonna diversa per ogni anno, per esempio 2018, 2019, 2020, con i dati delle vendite. Se noi abbiamo bisogno di avere una colonna Anno, con tutti questi dati, e poi una colonna Vendite, possiamo utilizzare il Pivot Step. Andremo poi a vedere l'Aggregate Step. Questo serve quando vogliamo combinare fra di loro due tabelle a un livello di aggregazione differente. È un po' quello che facevamo con l'operazione di Data Blending, quindi se abbiamo, per esempio, i dati di Actual a livello di giorno, e di dati di Budget a livello di mese, potremmo voler aggregare i dati di Actual a livello di mese, e dopodiché collegare queste due tabelle. Come collegarle lo vedremo successivamente, come al solito con il Join Step o l'Union Step. In sostanza eseguiremo le stesse operazioni di cui abbiamo parlato nei capitoli precedenti, ma anche queste a livello grafico, tramite il Drag & Drop e tramite il Join Step e l'Union Step. Vedremo inoltre che il Join Step e l'Union Step ci daranno più possibilità di quelle che avevamo su Tableau Desktop, e ci aiuteranno tantissimo a livello grafico a capire come stiamo unendo questi dati. Poi vedremo l'Output Step, vedremo infatti che potremo generare un file CSV, un file Excel, oppure andare a pubblicare direttamente su Tableau Server o Tableau Online. Potremo avere più Output Step in uno stesso flusso, quindi per esempio, potremmo andare a pubblicare una certa parte del flusso, e a generare un file da un'altra parte. Infine, parleremo del Tableau Prep Conductor; se noi vogliamo che le data source prodotte con il nostro flusso di Tableau Prep Builder siano aggiornate con la frequenza che scegliamo noi da Tableau Server o Tableau Online, dobbiamo pubblicare l'intero flusso, e schedulare questi aggiornamenti, in questo modo, anche se noi abbiamo compiuto delle operazioni abbastanza complesse sui nostri dati, tramite Tableau Prep Builder, possiamo far sì che l'aggiornamento sia assolutamente trasparente per noi. Bene, allora andiamo a scoprire come funziona Tableau Prep.