Pirámides mal hechas


Una de las partes de esta web que tiene más usuarios es la que se refiere a las pirámides y su construcción, y también es la que genera más consultas vía email. En particular la correspondencia con un historiador, Fernando Manzano Ledesma (Universidad de Oviedo), me ha proporcionado ideas y materiales con los que abrir una sección sobre los errores más frecuentes en estos gráficos. Empezaré con un caso significativo, para ir añadiendo otros en el futuro. Se trata de la pirámide dibujada con datos correspondientes a intervalos de edad de distinta amplitud, cuando se dibuja directamente, sin ponderar tales amplitudes:

La redistribución de los valores en función de la amplitud de los intervalos de edad

En cierto libro sobre Valencia de finales del siglo XVIII (muy recomendable desde el punto de vista documental y temático) podemos encontrar los siguientes datos y su representación:

La pirámide corresponde a los totales de cada sexo, y antes de seguir invito al lector a que dedique unos minutos a observar la tabla y el gráfico con ojo crítico, en busca del problema.

Un primer defecto, conceptual, es la confusión terminológica entre “distribución” y “estructura” (véase la diferencia en la página sobre las pirámides). Lo proporcionado en la tabla y lo representado en la pirámide es la distribución en números absolutos y, por lo tanto, no es la estructura (que siempre es en números relativos, casi siempre porcentajes).

Pueden hacerse pirámides tanto de números absolutos como de porcentajes, pero las primeras no tienen demasiada utilidad: si se trata de ver diferencias de volumen poblacional no tiene sentido complicarse haciendo pirámides; si se trata de ver diferencias en la estructura por edades inexcusablemente hay que hacer pirámides de porcentajes. De otro modo ocurre como al autor de ésta, que la ha construido junto a otra, de un municipio de la comarca. Puesto que el municipio es, lógicamente, de mucho menor tamaño que el total de la comarca, para que las dos pirámides sean comparables el autor usa escalas horizontales distintas para que, más o menos a ojo, las superficies de ambas sean similares y puedan destacar las diferentes formas.

Pero también ese es un intento frustrado, porque el problema principal es la propia representación gráfica. Aunque las barras se han dibujado con distintas alturas, en función de la amplitud de los intervalos de edad (hasta ahí todo es correcto), su anchura no se ha reducido en la misma proporción, de modo que el área representada en cada barra da una imagen engañosa, tanto más sobredimensionada cuanto mayor era la amplitud del intervalo (puede verse un caso similar, y su solución, en el Ejercicio Resuelto num. 5)

El paso que falta para hacer una representación correcta es repartir la población en intervalos iguales. En este caso, además, no queda más remedio que descender a los intervalos anuales simples, porque no hay ningún otro submúltiplo común a todas las amplitudes de intervalo que tenemos (en el Ejercicio 5 sí que era posible subdividir todos los intervalos para hacerlos quinquenales, porque todos tenían una amplitud que era múltiplo de 5).

Hay que hacer, por tanto, una nueva tabla por edades simples.

En las edades 0, 1, 2… hasta 7 habrá 43,04 hombres (344,3 dividido entre 8, que es la amplitud del intervalo de edad en cuestión) y 39,25 mujeres (314 dividio entre 8). En el siguiente intervalo, de 8-16, en cada edad tendremos 34,17 hombres (307,5 divido entre 9) , etc.

Con esta nueva tabla, la pirámide adquiere una forma muy diferente a la que nos proporcinaba el libro.

Se hace visible ahora una interesante peculiaridad de esta población: hay más personas por cada edad en el intervalo de 41-50 que en el de 26-40. Un fenómeno así podría resultar de diferencias generacionales al nacer (como ocurrió en el siglo XX en España durante los años de la guerra civil, que provocaron escasa natalidad y, por lo tanto, generaciones de menor volumen que las posteriores), también podría resultar de una emigración diferencial por edades, mayor entre los jóvenes, incluso podría tratarse de un defecto en la fuente de datos. En cualquier caso, ahora sí, la pirámide nos muestra su verdadera utilidad como herramienta analítica para el historiador, y plantea direcciones interesantes hacia las que dirigir la investigación.

(En realidad la pirámide sólo está esbozada a título ilustrativo. Como repito en otros lugares, su correcta presentación requiere también los títulos de los ejes, el título general y la obligada información sobre la fuente).

Un último comentario: aunque resulte extraño ver que se repite una misma barra en varios intervalos, ese es sólo un problema “de diseño gráfico” que se puede resolver de distintas maneras (asignando el mismo color a la línea que dibuja cada barra y a la superficie interior, por ejemplo). Lo importante es que se redistribuyan las áreas representadas en función de las distintas amplitudes de intervalo.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Julio Pérez Díaz, CSIC. Estudios de población y análisis demográfico

A %d blogueros les gusta esto: