De la difusión de partículas a la difusión de la información: visualizando datos geoestadísticos mediante cartogramas
Karina Mazzitello (Universidad de Mar del Plata) y Julián Candia (Universidad Nacional de La Plata).
La forma tradicional que se utiliza para visualizar resultados de censos y datos estadísticos en general es a través de diagramas de barras, de tortas y de cajas. En un diagrama de tortas a cada dato de una variable estadística dada le corresponde una porción de tamaño proporcional a su valor. Si el número de valores a representar es muy grande el diagrama de tortas resulta ilegible, debido a la gran cantidad de porciones requeridas en que se debería dividir la torta.
Por este motivo vamos a encontrar muchas veces en la literatura extensas tablas muy detalladas con datos estadísticos tediosas de leer, sin ser volcadas a ningún tipo de diagrama para no perder información. Si en lugar de tablas o los diagramas tradicionales, se utiliza un mapa que represente, por ejemplo, la incidencia de una epidemia dada con código de colores, inevitablemente se verá alta incidencia en ciudades y baja incidencia en zonas rurales debido a sus diferencias en la cantidad de habitantes.
Parecería a primera vista, que las zonas rurales fueran mas seguras, pero no necesariamente es así. Una alternativa es graficar la incidencia per cápita, que resuelve el problema a costa de descartar toda la información acerca de dónde ocurre la mayoría de los casos. Afortunadamente se puede combinar la densidad de población con datos geográficos para crear lo que podríamos llamar “cartogramas de difusión”, una forma mucho más eficiente y rápida para visualizar datos estadísticos de diferentes regiones, desde censos a mapas electorales.
A modo de ilustración de ésta técnica se ha aplicado recientemente el método de los cartogramas a la problemática de la criminalidad en los estados de Brasil (ver el artículo original. Veremos con este ejemplo la utilidad de los mismos y luego explicaremos cómo se construyen. Comenzaremos mostrando un mapa original de Brasil y luego lo compararemos con un cartograma de dicho país, conteniendo ambas gráficas información similar.
En la figura 1(a) se muestra un mapa original de Brasil que ha sido coloreado según las tasas de homicidio cada 100.000 habitantes, correpondientes al año 2008. Las regiones oscuras son más peligrosas que las claras. En la figura 1(b) se grafica un cartograma de Brasil con los estados deformados según la tasa de homicidios cada 100.000 habitantes (año 2008). Los estados más oscuros son los más poblados y los más claros los menos poblados. Las áreas deformadas del cartograma son proporcionales a las tasas de homicidio y revelan una alta tasa de crímenes en la región noreste. Se puede apreciar que no necesariamente los estados más poblados tienen una alta tasa de homicidios como por ejemplo San Pablo y Minas Gerais, cuyas regiones no son tan grandes y sin embargo están muy poblados.
Resulta mas fácil visualizar los datos en el mapa deformado de la figura 1(b) que en el mapa convencional de la figura 1(a). La utilidad de los cartogramas queda en evidencia: rápidamente se puede atribuir el tamaño de la región de un mapa a una variable elegida, que en nuestro ejemplo es la tasa de homicidios. Además, los mismos pueden colorearse siguiendo un código con otra variable, permitiendo así dos capas de visualización de datos. En la figura 1(b) se colorearon los estados en escala de grises de acuerdo a sus densidades de población y como se mencionó anteriormente la tasa de homicidios no está relacionada a la cantidad de habitantes. Claramente, la construcción de mapas deformados ayuda a develar correlaciones.
Las mediciones estadísticas realizadas sobre una población están frecuentemente correlacionadas entre sí, pero estas correlaciones permanecen ocultas si se utilizan directamente tablas o las herramientas tradicionales de visualización. Por ejemplo, en la figura 2 se muestra el mismo cartograma que en la figura 1(b) pero incluyendo un índice socioeconómico para cada estado. Las regiones rojas tienen menor nivel socioeconómico y tienden a una mayor tasa de homicidios. Es decir, hay una clara relación entre tasa de homicidios y el nivel socioeconómico dado por el acceso a empleo e ingresos, educación y salud. Verdaderamente esta correlación es fácil de visualizar en el cartograma de la figura 2.
Los cartogramas son gráficos elaborados a partir de una idea simple de la física asociada a los procesos difusivos de partículas. Supongamos que en una caja dividida por la mitad tenemos un gas que ocupa ambos lados de la caja a tempertura constante. Supongamos además, que en uno de los lados hay mayor densidad que en el otro. Si quitamos la pared que divide la caja habrá un flujo neto de partículas desde la región de mayor densidad a la región de menor densidad. El proceso difusivo alcanza un estado de equilibrio cuando la redistribución de partículas se homogeiniza. ¿Cómo se puede utilizar este fenómeno en la elaboración de cartogramas?
Si representamos una variable estadística (por ejemplo, las tasas de homicidios por provincia) como diferentes densidades de partículas podemos estudiar su difusión hasta alcanzar el estado homogéneo. Con su desplazamiento, estas partículas arrastran los contornos de cada región del cartograma. El resultado es un mapa deformado cuya distorsión refleja la información estadística que se proporcionó como punto de partida. Retornando a los homicidios se pueden construir cartogramas de barrios en lugar de estados y hacer el análisis más focalizado.
Este artículo pretende ilustrar la potencialidad y riqueza del método en una temática concreta para llamar la atención sobre su empleo como algo novedoso para la visualización de datos geográficos multidimensionales. También se puede aplicar esta técnica a diversas problemáticas locales o regionales, como por ejemplo la incidencia y distribución de determinadas enfermedades, epidemias, resultados de elecciones, censos y otros datos estadísticos con información geográfica. Recientemente el CONICET ha aprobado un proyecto para lanzarlo como herramienta de divulgación de datos geo-estadísticos a escala nacional y de alcance latinoamericano a través de una página web que será construida en el presente año.