Data Quality - Approccio Metadata Driven

Nell’ambito del Partner Program di Irion, noi di B.I. Strategy siamo presenti da oltre un anno con un team di giovani Data Engineers certificati all’utilizzo del software Irion EDM a supporto dell’area consulting della software house tutta italiana per conto di importanti clienti del settore bancario e assicurativo.

I clienti con cui abbiamo collaborato desideravano un unico impianto di governo completo in grado di condurre processi di gestione di dati afferenti più uffici e funzioni aziendali.

Requisiti di business e Criticità

Per il Gruppo Assicurativo REALE MUTUA abbiamo collaborato con la software house allo sviluppo di una solution di data quality.

Il cliente partiva da un’esigenza specifica legata alla tematica del rispetto dei tempi di fast close ovvero la chiusura dei bilanci in ambito Solvency II entro un termine imposto da IVASS; desiderava, inoltre, trasparenza nell’acquisizione, trasformazione e validazione del dato, il tutto conservando la piena disponibilità dei dati.

Il problema che riscontrava nell’utilizzo di altri applicativi era l’armonizzazione dei dati, inizialmente legati unicamente a tematiche di riassicurazione, banche e finanziarie di tutti gli stakeholder del Gruppo compresi i partner.

Data Quality – Metadata Driven Solution

L’approccio utilizzato per lo sviluppo su AB2020 di IRION è definibile ‘metadata driven’ ovvero guidato dai metadati.

I più comuni impianti di data quality eseguono test sui dati senza disporre di informazioni a corredo, unico modo è interpretare il codice dello sviluppatore o avvalersi della documentazione associata al controllo. Sfruttando l’approccio ‘metadata driven’, sebbene la componente esecutiva e quella di governo dati siano disaccoppiate in termini di codice, un sistema di metadati centralizza il tutto fornendo importantissime informazioni in particolare l’algoritmo eseguito, il criterio di qualità verificato, quale set di dati è stato analizzato, periodicità e tutto ciò che l’utente di business ha richiesto; così facendo si trasforma la descrizione grezza del dato in informazione.

Più in generale, le tre macro-tipologie di metadati inseriti, interconnesse tra loro, sono: business (es. business glossary, semantica proprietaria), tecnici (es. formato e dimensione dei campi) e operativi (es. tempi di schedulazione e archiviazione risultati dei controlli).

Risultati ottenuti

Il cliente, ora, dispone di un unico repository di dati storici, pienamente integrato con i propri asset informativi. L’esigenza del rispetto dei tempi, invece, è stata soddisfatta sfruttando una delle capabilities del prodotto, ovvero ‘orchestration & automation workfolw engine’, tramite cui sono stati realizzati reminder per i data producers, così da produrre in tempo tutti i dati necessari da elaborare, trasformare e validare e successivamente integrare in dashboard di controllo e gestione del calendario delle scadenze.

Domenico De Matteis