Visualització de dades. Part (II), qüestió de formes

Després d’un primer lliurament, en el qual vam veure una primera aproximació a la història i conceptes fonamentals de la visualització de dades, continuarem amb una sèrie d’articles en els quals intentarem donar una sèrie de consells i millors pràctiques en l’aplicació d’elements visuals, perquè puguem treure el màxim partit de les nostres anàlisis.

Amb l’objectiu d’explicar amb una visualització que s’ajusti a la representació de les relacions, tendències, entre molts valors diferents, les diferents plataformes analítiques posen a la nostra disposició una varietat d’elements gràfics que, utilitzats amb certa perícia, permetran que aquells que utilitzin els nostres informes i quadres de comandament, puguin analitzar aquestes dades d’un cop d’ull. Seguint una sèrie de pautes o «receptes», podem realitzar aquesta selecció d’elements d’una forma molt més àgil, i abandonar les representacions inconsistents, o que presenten menys valor, així com començar a perdre la por de la «tela en blanc» a què ens enfrontem quan hem d’analitzar una nova mesura o dimensió dins dels nostres projectes.

L’elecció d’una visualització per representar l’anàlisi de dades és, com resa el nostre títol, i en bona mesura, qüestió de formes

Abans de començar amb aquesta sèrie de recomanacions, basades en diferents situacions i propòsits a què ens podem enfrontar, vegem un exemple que evidencia que l’elecció d’una visualització per representar l’anàlisi de dades és, com resa el nostre títol, i en bona mesura, qüestió de formes. Pensarem, per exemple, en l’anàlisi de l’acompliment d’una determinada activitat al llarg dels mesos, poden ser nombre de ciutadans atesos, imports de subvencions executades… en el nostre cas, anotacions de sortida registrades al llarg dels mesos esmentats. Vegem la seva representació amb dades idèntiques, als gràfics següents:

Anotacions de sortida registrades

En el primer dels gràfics afrontem la comparació d’aquesta execució al llarg dels mesos a través d’un gràfic de pastís. Amb aquesta visualització podem veure el pes específic de cada mes respecte a la resta i al total, però, com es fa evident, ens resulta complex evidenciar una tendència en no comptar amb una representació del curs del temps (quan tenim amb una dimensió que succeeix al llarg del temps, necessitem algun element gràfic que representi aquest eix temporal). Pràcticament el mateix podem dir del gràfic de blocs posterior, també confús per a la nostra necessitat. Si avancem, el gràfic de barres, amb l’eix x representant la dimensió ‘mes de registre’, i les columnes representant la mesura ‘càlcul d’anotacions registrades’, ens ajuda a representar fidelment els valors de cada un dels mesos, comparar-los ràpidament entre si, i, a més, poder confirmar quina és la tendència durant l’exercici de representació.

Així doncs, veiem, a través d’un exemple molt senzill, com d’important que és donar amb la representació adequada en cada cas. I no sempre les situacions a què ens enfrontem són tan senzilles com la que hem fet servir com a introducció.

De cara a facilitar la seva selecció, s’han escrit nombroses guies i mètodes, sent potser el més conegut el diagrama de selecció de gràfics que el Dr. Andrew Abela va crear com a part del seu mètode global de representació (Extremi Presentation). Basant-nos, i adaptant en part per adequar-lo a nous elements gràfics ja en ús, desengranarem una petita guia de selecció d’aquests elements segons l’escenari de representació a què ens enfrontem.

El primer pas per a la selecció de l’element adequat passa per identificar quin és el propòsit principal de la representació que pretenem obtenir. Per a això, hem de contestar a una de senzilla, encara que de vegades no tant, pregunta sobre què volem representar amb les dades. En el mètode esmentat, com en altres adaptacions del mateix, s’identifiquen a través de diverses agrupacions principals.

El primer pas per a la selecció de l’element adequat passa per identificar quin és el propòsit principal de la representació que pretenem obtenir.

Comparació, és habitual que les nostres anàlisis necessitin comparar magnituds entre si per poder trobar fàcilment els valors més alts, i els més baixos, identificar valors mitjans, etc. Així podem necessitar veure quins usuaris tenen una càrrega de treball assignada superior, aquells que estan exercint un temps mitjà de resolució, equips que atenen un nombre superior de ciutadans per dia…

També podem voler comparar aquestes magnituds al llarg del temps, comparant valors antics amb altres de més moderns, comparant exercicis, mesos, revisant tendències. Com hem vist en el primer dels exemples, i fins i tot tractant-se d’un propòsit comú de comparació, la inclusió de dimensions temporals farà que hàgim d’adequar el tipus de gràfic que s’ha d’utilitzar.

Comparació

Relación, este tipo de gráficos nos van a permitir ver cómo se relacionan los valores, medidas entre sí permitiéndonos así encontrar correlaciones, valores típicos, así como identificar “clústeres” (grupos de elementos de una dimensión que comparten comportamientos en los valores/medidas equiparables) de datos.

Als gràfics de relació, els eixos són pròpiament les escales de les mesures que es confronten, i es representa un element per cada valor de les dimensions d’anàlisi. Per poder comparar fins a tres mesures alhora, es juga amb la mida de cada un d’aquests punts (en aquest cas es parla habitualment de gràfic de bombolles).

Escales de mesures

Composició, quan necessitem analitzar com es componen els elements que constitueixen un valor total, utilitzarem aquest tipus de gràfics. Necessitem veure percentatge de notificacions en paper i en format electrònic, veure com es distribueixen el nombre d’expedients assignats per cada usuari del nostre equip… A més, també podem necessitar representar com evoluciona aquesta composició al llarg del temps.

Així doncs, comptarem amb gràfics de caràcter estàtic, en els qual no inclourem necessàriament una dimensió temporal, com poden ser el gràfic de pastís, el gràfic de cascada o el de blocs. En el cas que vulguem analitzar canvis al llarg del temps podrem basar|-nos en gràfics de barres o de línies, en els quals apilem els diferents valors de composició per a cada període.

Els gràfics de composició, segons ho necessitem, poden representar aquestes composicions en percentatge, o bé en valors absoluts que conformin el valor absolut total.

Gràfics de composició

Distribución, con estos gráficos vamos a poder explorar cómo se distribuyen los valores/medidas dentro de nuestros datos. Muestran por tanto las formas de estos datos, rangos de valores que alcanzan, así como la identificación de posibles valores atípicos.

A través d’histogrames, gràfics de dispersió i diagrames de distribució serem capaços de veure el comportament habitual de la nostra informació, així com localitzar elements discordants dins del set de dades amb què estiguem treballant.

Rendiment o acompliment segons on consultem. Els utilitzarem quan vulguem una visualització ràpida dels valors associats a les nostres mesures. D’aquesta forma habilitem un camí «ràpid» perquè l’usuari analista pugui verificar si les dades resultants es troben dins de l’esperat, utilitzant-les com a «punt d’entrada» per a la utilització de la resta de gràfics que hem vingut comentant.

Els elements totalitzadors com el KPI (key performace indicator, com a text ressaltat com totalitzador), els indicadors o velocímetres ens serviran per veure de forma ràpida com estem treballant en una determinada àrea, fins i tot comparant els seus valors amb algun tipus de llindar o objectiu.

Detall de dades, no ens hem d’oblidar en tot cas, que, com a part d’una possible representació gràfica, comptem amb les dades en format de taula. En ocasions necessitem valors exactes, o bé volem obtenir el màxim nivell de detall o un registre concret.

Geogràfic, cada vegada la dimensió geogràfica, gràcies a que comptemi cada vegada més amb informació georeferenciada, han passat a formar part del catàleg indispensable dels generadors de contingut analític.

Podent representar la informació en diferents capes que poden encavalcar-se, o bé anar apareixent segons anem navegant pel mateix, són tota una àrea d’anàlisi en si mateixos i seran objecte d’una visió detallada a futures publicacions.

Com hem vist comptem amb una àmplia «paleta» d’elements analítics que podem utilitzar en els nostres estudis de dades, i en ocasions la seva elecció i utilització pot generar-nos dubtes. Seguint i identificant el propòsit d’allò que volem representar i analitzar, aquesta tasca se simplifica, sobretot si podem donar-nos suport en esquemes d’elements gràfics com els que hem presentat i que segur serviran de guia en el desenvolupament d’aquestes solucions analítiques.

Tot i així, comptem amb elements addicionals al tipus de gràfic que utilitzarem per a cada combinació de dimensió o mesura

Existeixen altres tipus de gràfics addicionals, però sempre podem enquadrar-los en major o menor mesurada en alguna de les categories comentades, de manera que es faciliti també la seva utilització.

Una vegada que comptem amb la perícia d’utilitzar aquest tipus d’esquemes en el nostre dia a dia, «mantenir les formes» en els nostres projectes de visualització de dades se simplificarà i serà molt més ràpid. Tot i així, comptem amb elements addicionals al tipus de gràfic que utilitzarem per a cada combinació de dimensió o mesura, com ho són el color (que ens donarà profunditat a les nostres representacions i anàlisi) i la pròpia disposició d’aquests elements perquè potenciïn la informació combinant-los. Seran objecte de següents articles de visualització de dades, tot amb l’objectiu que no sigui necessari ser «un Charles Minard» per donar amb la visualització adequada.

Compartir: