Concepte i contextualització
La Dada, actualment estem immersos en una generació constant de dades en diferents formes i formats, i en els últims anys s’ha vist un gran potencial amb l’explotació i tractament de totes aquestes dades per convertir-les en informació útil a la presa de decisions. Per això, han aparegut conceptes nous, com data governance, data management, data architecture, business inteligence, etc
En certa mesura, tots tenim clar la utilitat de la generació de les dades, ja que tots nosaltres generem diàriament milions de dades que tercers analitzen, per exemple, per oferir-nos publicitat dirigida. A més, la generació de les esmentades dades està en constant evolució i es generen orientades a un objectiu, fins i tot es dissenyen noves dades per a nous objectius.
L’any 2019, moltes empreses i entitats van realitzar una gran inversió en processos de transformació digital i, juntament amb això, es va apostar pels Big Data, que permeten capturar informació, i pels Business Intelligence, que permeten l’anàlisi i la presa de decisions. Gràcies a tot això, s’ha creat un actiu digital molt important.
Però què passa quan estem parlant de dades històriques? Dades generades fa anys, amb mètodes o eines obsoletes ens poden servir aquestes dades per analitzar informació actual, fins i tot informació a futur? Analitzarem la solució des del punt de vista de la migració de dades.
Migració de la Dada
Un dels principals objectius en tota migració de dades és, no només el traspàs d’informació, sinó la realització del traspàs amb garantia que les dades que estem movent disposaran de prou qualitat per ser explotades per l’eina destí de les mateixes.
En les primeres fases d’anàlisi d’un projecte de migració, es considera la Qualitat de les Dades des del minut zero, ja que una primera pregunta que ens hem de respondre en abordar el projecte és…
Volem tenir la dada o volem tenir la dada útil?
En funció de la resposta s’aborda el projecte de forma completament diferent:
- Si es vol realitzar una migració per disposar de les dades per consultar-les quan les necessitem, simplement es requerirà un trasllat de la dada tal com sigui en origen.
- Si volem disposar de la dada, però que a més puguem analitzar-ho juntament amb la informació generada amb el dia a dia, s’ha de revisar, completar, contextualitzar… segons l’eina destí.
És en aquest segon cas, sobretot, on entren els processos de la Qualitat de la Dada per poder garantir que la migració acabarà amb una dada útil que permeti ser analitzada com una dada més dins de les eines d’anàlisi que s’utilitzin per a això.
Dins d’un projecte de migració, el procés de Qualitat de la Dada comprèn els següents aspectes:
- Neteja. S’analitzen possibles deficiències o incoherències en les dades i es corregeixen per donar-los consistència. S’eviten dades errònies i s’evita traslladar al destí dades que poguessin provocar errors.
- Normalització. Es realitza una estandardització i unificació de dades entre eina d’origen i eina destí, unificació de codificacions, tipologies, classificacions, etc. De manera que una vegada traslladada la dada es pot analitzar juntament amb les ja existents.
- Completació. Si el destí ho requereix, es poden enriquir les dades d’origen i reestructurar-les de manera que seran cent per cent útils en l’eina destí. Fins i tot es poden completar les dades de diferents orígens o diferents eines per arribar a un model de dada comuna i analitzable en destí.
Aquests aspectes han de ser tractats amb especial cura en qualsevol procés de migració que requereixi un elevat nivell en el seu data quality, i no només des del punt de vista de la dada, sinó de l’eina origen que el va generar i sobretot de la utilitat que se li vulgui donar a aquesta dada en l’eina destí.
Aquest mateix any (maig-2022), el ministeri ha publicat una sèrie de normes tècniques referents a la qualitat de la dada per ajudar a les organitzacions públiques a aconseguir un dels principals objectius a què s’enfronten, que és la transformació de dades en coneixement per a la presa de decisions.
https://datos.gob.es/es/blog/normas-tecnicas-para-alcanzar-la-calidad-del-dato
Concretament en la Norma ISO 25012 es detallen les característiques que ha de complir
Conclusió
Així doncs, els projectes de migració es poden considerar com una fita dins del data governance que permeti enriquir les bases de dades amb dades històriques i prendre decisions per millorar i optimitzar cada un dels processos diaris.
La qualitat de la dada no està directament relacionada amb el procés de migració, sinó amb el de generació. Però, com hem pogut veure, el moment de la migració pot ser un bon moment per realitzar i revisar la utilitat i poder treure el màxim profit al nostre ecosistema de dades.