Le fasi del suo processo sono: Estrazione, Trasformazione, Caricamento. Vediamole al dettaglio:

La prima fase è quella dell’Estrazione e consiste nell’estrazione dei dati da sistemi sorgenti, quali database transazionali (OLTP) comuni file di testo o da altri sistemi informatici (ad esempio, sistemi ERP o CRM). Tre sono le alternative che è possibile seguire nella fase di estrazione dei dati : gli sviluppatori potranno scrivere dei programmi ad hoc, oppure scegliere in alternativa di affisarsi a dei TOOL ETL presenti sul mercato, oppure utilizzare entrambe le soluzioni.
La seconda fase è quella della Trasformazione e consiste nel trasformare i dati precedentemente estratti e prepararli per una nuova collocazione, es.:
Selezionare solo quelli che sono di interesse per il sistema; Normalizzare i dati (per esempio eliminando i duplicati); Tradurre dati codificati; Derivare nuovi dati calcolati; Eseguire accoppiamenti (join) tra dati recuperati da differenti tabelle;Raggruppare i dati
Tale trasformazione ha lo scopo di consolidare i dati, cioè rendere omogenei dati provenienti da sorgenti diverse e fare in modo che siano più vicini alla logica di business del sistema di analisi per cui viene sviluppato.
La terza e ultima fase è quella del Caricamento e consiste nella memorizzazione delle informazioni nelle base dati di destinazione.
Occorre prestare particolare attenzione alla granularità delle informazioni da memorizzare nella stuttura a valle. Queste infatti, non solo devono essere aggregate in modo da non avere un dettaglio eccessivo (cosa che potrebbe portare ad un decadimento delle prestazioni delle interrogazioni effettuate sul sistema), ma devono anche mantenere una granularità che consenta di effettuare le necessarie analisi sui dati.
Alcuni ETL Software SmartDB Workbench:
DataStudio – Integrator - Informatica PowerCenter – Datastage IBM - SSIS Microsoft –
I-service IngeniumTechnology - Scriptella ETL – Benetl - Oracle Data Integration Suite –
Kettle Pentaho Data Integration.
Nessun commento:
Posta un commento