Migració: Cirurgians de les dades

En un procés de migració, una vegada definida l’estratègia a seguir i planificat el projecte de migració, ens disposarem a “operar”: establim un analogisme entre una operació de trasplantament i un procés de migració:

El cirurgià és l’especialista amb grans habilitats que utilitza una sèrie d’instruments i tècniques específiques, i té un gran coneixement en àrees científiques, anatòmiques i fisiològiques. A més, assisteix tots els interessats, tant el pacient com la resta dels equips mèdics, i s’hi comunica.

El “migrador” és aquest especialista, que a l’igual del cirurgià, treballa amb instruments i tècniques específiques, ha de tenir un coneixement altíssim en la matèria a migrar, assisteix la resta de l’equip i s’hi comunica.

La migració és una operació de trasplantament: s’extreu la informació d’un sistema i es trasllada a un altre sistema, de manera que tot continuï funcionant.

La migració és una operació de trasplantament

La informació, igual com els òrgans que es trasplanten, són vitals i formen part de l’ésser, ja que sense la informació la immensa majoria de les vegades és difícil continuar.

En un trasplantament d’un òrgan, tant el coneixement del cirurgià com les tècniques que es fan servir són crucials. Això mateix passa en una migració, tant el coneixement com les eines són molt importants.

En aquest article, ens centrarem en les tècniques. Tecnològicament, cal disposar dels instruments necessaris que ens permetin arribar a les profunditats de les dades i donar-nos tota la informació per poder prendre decisions i, sobretot, minimitzar els riscos inherents a les migracions.

Una de les tècniques més emprades són els processos ETL: extreure, transformar i carregar (load). Aquest és un enfocament tradicional pel que fa a la migració i, com diu el seu propi nom, està composta per tres passos:

  • Extreure les dades dels diferents sistemes d’origen.  Durant aquest pas les dades es llegeixen i recopilen de les diferents fonts de dades origen: bases de dades, sistemes de fitxers, aplicacions, esdeveniments…
  • Transformar les dades. En aquest pas es validen, normalitzen i homogeneïtzen les dades, es fa el canvi de formats i també els processos d’ordenació i filtratge. En aquesta fase, les dades extretes es converteixen a un format acceptat perquè el pas següent ho entengui.
  • Carregar les dades al sistema de destinació. Aquest pas el pot dur a terme un procés automàtic, és a dir, és possible estandarditzar la càrrega de la informació.
ETL

En cada un d’aquests passos hem de seleccionar les eines que ens ajudaran a dur-los a terme. Hi ha eines de mercat, però quan es tracta d’un procés de migració a mida, ens haurem de construir les nostres pròpies eines.

A l’igual de les eines que utilitza el cirurgià, aquestes han de tenir un seguit de capacitats que ens permetin dur a terme la intervenció amb èxit. Segons un informe publicat per Gartner, es destaquen les capacitats següents:

  • Capacitat per connectar i adaptar-se a les diferents fonts de dades.
  • Capacitat per lliurar les dades a altres bases de dades, aplicacions o processos.
  • Capacitat per transformar les dades. Des de conversió de dades i càlculs simples fins a processos més complexos.
  • Capacitat per modelar dades, crear i mantenir models de dades, fer la metadada i documentar-ho.
  • Capacitat per dissenyar l’entorn de desenvolupament.
  • Capacitat per gestionar les dades.
  • Capacitat per adaptar-se a les plataformes de maquinari i els sistemes operatius existents.
  • Capacitat d’operació i administració, com són gestió d’errors, controls de seguretat, monitoratge, etc.
  • Capacitat d’integració amb els diferents components que formen l’eina.
  • Finalment, ha de ser una arquitectura orientada a serveis.

La tècnica ETL funciona a la perfecció quan ens trobem fonts de dades estructurades, volums de dades a processar manejables i processos de transformació intensos.

En els últims temps, ha sorgit un nou enfocament: ELT:  extreure, carregar i transformar que atén les noves necessitats. Si amb les tècniques ETL, les dades es mouen des de la font de dades fins a l’emmagatzematge provisional, amb les tècniques ELT aprofitem el magatzem de dades per fer transformacions bàsiques.

L’aparició d’aquest nou enfocament no significa que les tècniques ETL deixin d’estar en vigor; al contrari, tots dos enfocaments conviuran i es podran fer servir segons les necessitats. En articles següents aprofundirem en les diferències entre les dues tècniques.

Com a conclusió i seguint el nostre analogisme, ens trobem davant d’un procés de trasplantament d’informació, en el qual utilitzem diferents eines. El nostre objectiu serà trasplantar la informació amb èxit i descobrir pel camí aquella informació que posa en risc la nostra migració:

Serem capaços de trobar aquestes cèl·lules malignes que es localitzen a les dades, rebentar-les i rebutjar-les?

Serem capaços de trobar aquestes cèl·lules malignes que es localitzen a les dades, rebentar-les i rebutjar-les?

Compartir: