PDF (Capítulo 3)

Anuncio
3. Análisis de la distribución
espacial de los datos
Una de las ventajas de la tecnología actual es la generación de datos, en este sentido, cada
disciplina puede pensar en la mejor posibilidad de utilizarlos en función de sus propios
problemas. Una de las tareas de la geografía se ha centrado en la localización, y principalmente, en la comprensión y explicación de determinados elementos sobre el espacio.
Los geógrafos suelen enfrentarse a la posibilidad de localizar bajo unos objetivos ligados
a la planeación u ordenamiento del espacio, dicha localización puede planteare en dos sentidos: uno, en cuanto al aprovechamiento de un recurso, por ejemplo, un lote baldío; y dos,
en cuanto a la localización de un lugar cuya posición imparcial deba favorecer a muchos o
aprovecharse al máximo, como ocurre con un puesto de salud o un centro educativo. La
diferencia entre los dos radica en la importancia que se le da a la localización misma, lo que
puede modificar las decisiones si se piensa en la relación que dicha localización puede tener
con su entorno inmediato o más allá.
Las medidas de resumen, como técnicas de análisis espacial, le otorgan al geógrafo la
posibilidad de localizar con precisión y objetividad ciertos elementos a nivel espacial por
medio del tratamiento estadístico de algunos datos. El presente capítulo no solo se centra en
la obtención de estas medidas, sino en la espacialización gráfica de las mismas.
Desde la Estadística se proponen tres formas de describir los datos, como un paso básico
para su transformación en información; son estos:
• Las representaciones gráficas
• Las distribuciones de frecuencias
• Las medidas de resumen
3.1 Las representaciones gráficas
Diagramas y/o gráficos se constituyen en esquemas visuales, que muestran una o más ideas
por medio de diferentes variables que son organizadas según reglas específicas que permiten
acceder más fácil y didácticamente a la información. Bertin (1968) define los diagramas como
“la construcción gráfica en que las correspondencias en un plano pueden establecerse entre
todas las divisiones de una y otra componente que explican un fenómeno”. 1
Cabe agregar que, hablar de representaciones gráficas desde la geografía implica necesariamente incluir los mapas, puesto que en estos se hace posible la concretización de algunos
1
En los demás capítulos de este trabajo, se presentan algunas herramientas gráficas de gran utilidad.
fenómenos, mediante la espacialización de variables, que en ocasiones, no son fácilmente
visibles en la realidad, pero que hacen parte de la dinámica y caracterización del espacio.
3.2 La distribución de frecuencias
Es un método que utiliza tablas denominadas de distribución de frecuencias, con las
que se busca ordenar los datos y describir el número de veces que ocurre un resultado
dentro de un conjunto de observaciones. Según Carrera, et al (1993) “la distribución de
frecuencias permite expresar con mayor claridad el grado de regularidad o irregularidad con
que se distribuyen los diferentes valores que toma una variable”. Por su parte Harnett y
Murphy (1987) resaltan la importancia de este tipo de distribución para hacer una “indicación más precisa de la información disponible”, contraria a las representaciones gráficas que
“proporcionan una representación de la información y no de los datos en sí mismos”.
El siguiente es un ejemplo de una tabla de distribución de frecuencias.
Cuadro 3.1 Tabla de distribución de frecuencias
Viviendas
Xi
A
B
C
D
E
ni
5
8
3
2
4
Frecuencias Absolutas
Ni
5
13
16
18
22
Frecuencias Relativas %
fi
Fi
23
23
36
59
14
73
9
82
18
100
La primera columna (xi) muestra la variable a distribuir, en este caso viviendas.
La segunda columna (ni) muestra el número de veces en que ocurre un fenómeno; aquí
presentamos el número de personas que habitan en cada una de las viviendas.
La tercera columna (Ni) corresponde a la suma de una frecuencia absoluta con la adyacente en dirección descendente.
La cuarta columna (fi) muestra el número de veces en que ocurre un fenómeno en relación
con el total de observaciones, presentándose en porcentajes.
La quinta columna (Fi) corresponde a la suma de una frecuencia relativa con la adyacente
en dirección descendente.
3.3 Las medidas de resumen
Son técnicas cuantitativas que permiten hacer una descripción general del conjunto de
datos, a partir de la obtención de un sólo dato. De acuerdo a Harnett y Murphy (1987), el
propósito es reducir la información a una medida simple.
Este tipo de medidas son útiles para el análisis espacial en tanto hacen posible describir la
distribución de un fenómeno geográfico en función de su concentración o su dispersión, lo que
permite inferir que los datos implicados en este tipo de medidas tienen un carácter puntual.
Las medidas de resumen se clasifican en dos grupos:
• Las medidas de tendencia central: moda, mediana y media
• Las medidas de dispersión: desviación típica, varianza y covarianza.
DATOS GEOGRÁFICOS
Las medidas de resumen proporcionan un tratamiento adecuado de los datos puesto que
tienen en cuenta sus características temáticas y ante todo su componente espacial; en este
sentido, los resultados arrojados por este tipo de medidas pueden reforzar la localización de un
punto o, sugerir un nuevo emplazamiento para el mismo, haciendo un poco más objetiva la
toma de decisiones, sin embargo cabe recordar que a pesar de la exactitud que estas medidas
puedan tener, es el investigador quien utiliza tanto los métodos como los resultados, de acuerdo a sus requerimientos reales y a las posibilidades que proporciona el espacio.
3.3.1 Las medidas de tendencia central
Son aquellas que se “caracterizan por sintetizar las posiciones de toda una estructura de
localizaciones en un solo punto”. Son útiles especialmente para estudios evolutivos en los
que “se analiza la posición de los puntos en diferentes etapas o en trabajos comparativos en
los que se constatan dos o más fenómenos espaciales independientes”. (Gamir, et. al. 1995).
La ventaja de éste tipo de medidas, tanto estadísticamente como espacialmente, es que
no requieren un proceso matemático complejo. No obstante, la espacialización de algunos
de sus resultados puede en ocasiones no corresponder con la realidad geográfica.
3.3.1.1 La Moda
Es el valor que se repite el mayor número de veces dentro de un conjunto de datos.
Para los siguientes datos:
34
5,7,3,2,8,4,1,6,5,3,8,3,5,7,2,4,3,4,6,2
La moda es 3
Es probable que en un conjunto de datos exista más de una moda. Por ejemplo en el
siguiente conjunto de observaciones:
3,5,7,2,4,3,4,5,6,2,8,3,5,6,1,4,8,2,3,7,5
Los datos que más se repiten son 3 y 5, por lo tanto estos representan la moda.
En geográfia, cada dato corresponde a un emplazamiento. De acuerdo al tipo de escala
que se desee utilizar, cada dato puede convertirse en un punto. La moda en este caso corresponderá con el área que contenga mayor densidad de puntos (datos).
¿Cómo se halla la moda en un conjunto de datos espacializados?
MADRID, A. & ORTÍZ, L.
Nuestro problema a solucionar es el siguiente: En la zona sur de la cabecera municipal de
Gámeza, se busca emprender una campaña de salud, para lo cual se ha pensado en determinar
cual es el área que tiene el mayor número de viviendas, para dar mayor cubrimiento en el
menor tiempo posible.
Se escoge una escala que cubra toda el área y que además permita que cada dato sea
representado por un punto. En este caso hemos escogido la escala: 1:10.000
Se traza una cuadrícula sobre el área. El tamaño de la misma es decisión del investigador, sin embargo éste debe pensar en dos elementos básicos: la distancia a recorrer en función del problema y la posibilidad de encontrar un tamaño adecuado para la cuadrícula que
responda eficazmente a una solución. En nuestro caso hemos utilizado dos tamaños diferentes de plantillas.
Seguidamente procedemos a contar el número de puntos en cada uno de los cuadros
para determinar el que tiene mayor densidad.
Cuadro 3.2 Número de viviendas por cada uno de los cuadros de la plantilla
Cuadro
No
1A
2A
3A
4A
5A
1B
2B
3B
4B
5B
1C
2C
3C
4C
5C
1D
2D
3D
4D
5D
1E
2E
3E
4E
5E
Número de
viviendas
6
15
2
2
3
12
11
4
1
7
12
10
3
4
3
8
11
6
15
5
6
13
10
6
7
35
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
En la figura 3.1, tenemos 25 cuadros (4cm x 4cm), cada uno de ellos representa 1.600
m , pero encontramos que existen dos modas, las correspondientes a los cuadros 2A y 4D,
que se encuentran bastante separados uno del otro y cada uno con 15 viviendas, lo cual
probablemente dificultaría cumplir con el objetivo de la campaña que es hacer un mejor
cubrimiento en el menor tiempo posible.
Se opta, entonces por ampliar el tamaño de la cuadrícula; la figura 3.2 presenta áreas de
2.500 m2, el cuadro que tiene mayor densidad es el 2D, con 21 viviendas.
2
Cuadro 3.3 Número de viviendas por cada uno de los cuadros de la plantilla
36
Cuadro
No.
1A
1B
1C
1D
2A
2B
2C
2D
3A
3B
3C
3D
4A
4B
4C
4D
Número de
Viviendas
9
20
17
6
19
15
13
21
1
2
16
10
6
8
8
12
3.3.1.2 La mediana o centro mediano
En términos estadísticos la mediana corresponde al dato que se ubica en todo el centro
de las observaciones ordenadas, dejando la misma cantidad de datos a lado y lado de éste.
En los siguientes datos:
1, 2, 6, 8, 8, 9, 10, 12, 13, 15, 16, 17, 20, 21, 21
La mediana corresponde al número 12.
Cuando el número de datos es par la mediana corresponde al valor medio entre los dos
datos ubicados en el centro, así:
17, 18, 21, 23, 26, 27, 27, 27, 28, 30, 31, 31, 32, 34, 36, 36, 39, 40, 40, 42
La mediana es 30.5 como resultado de: 30 + 31
2
MADRID, A. & ORTÍZ, L.
En geografía, según Gamir, et. al. (1995) “el centro mediano de una estructura de puntos es
aquella posición en la que se produzca una reparto equitativo de las observaciones puntuales en las
direcciones N, S, E y O”. Es una medida “ideal” en tanto se busca la localización de un punto que
sea relativamente equidistante a todos los demás puntos que lo rodean, sin embargo tal emplazamiento corre el riesgo de corresponder a un lugar que no obedezca a las especificaciones planteadas
en el problema inicial, por ejemplo: una laguna, un río, una pendiente fuerte...
¿Cómo se halla la mediana en un conjunto de datos espacializados?
Continuando con el problema anterior, ahora se requiere ubicar un puesto promotor de
salud que brinde los primeros auxilios, que esté pendiente de las remisiones y que capacite a
la comunidad sobre infección respiratoria agua, enfermedad diarréica aguda, nutrición básica
y cuidado de los niños en casa; este lugar, debe además funcionar como un centro de concentración temporal para algunos especialistas.
El área de estudio en este caso, fue determinada a partir de la mayor concentración de viviendas que se estableció en el problema anterior. Se procedió a trazar un eje y a ubicar su centro, de tal
forma que conservara la misma cantidad de viviendas en cada cuadrante (figura 3.3).
Fig. 3.3 Centro Mediano
39
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
Este procedimiento no implica operaciones de tipo matemático, basta desplazar los ejes
hasta obtener el resultado deseado. En nuestro caso la distribución de los puntos sólo nos
permitió una orientación de los ejes, pero es posible que para un mismo problema, dicha
orientación señale varios centros medianos.
El centro mediano, a diferencia del centro de gravedad, proporciona un resultado óptimo
en términos prácticos, sin embargo, como afirma Ebdon (1982) “hay que limitar su uso a
investigaciones geográficas preliminares, en las que cuenta más la rapidez que la precisión”.
3.3.1.3 La media aritmética o centro de gravedad
La Media Aritmética es lo que la estadística denomina como el promedio. Consiste en la
suma de los datos dividida en el número total de éstos. Esta medida depende considerablemente del valor que toma cada dato, es así como un sólo valor puede hacer desplazar la
media hacia un punto y otro de las observaciones y no representar el fenómeno o la situación adecuada.
En el siguiente conjunto de datos:
40
24, 36, 25, 19, 28, 31, 34, 22, 32
La media resulta al aplicar: X = Σx
n
X = 24 + 36 + 25 + 19 + 28 + 31 + 34 + 22 +32
9
X = 251
9
X = 27,8
Geográficamente, se habla de un centro de gravedad que incluye las dimensiones x e y,
con la idea de ubicar la media aritmética de las localizaciones como tales y no del valor que
éstas puedan tener.
¿Cómo se halla el centro de gravedad en un conjunto de datos espacializados?
2
En términos prácticos no resulta fácil manejar coordenadas geográficas, puesto que sus valores son mucho más
altos, imprimiendo cierto grado de dificultad.
MADRID, A. & ORTÍZ, L.
Para aplicar este procedimiento al ejemplo anterior, procedemos a trazar un eje de coordenadas en la misma área de estudio. Para facilitar el trabajo, a cada punto se le asignó una
letra (figura 3.4) y se determinaron sus posiciones, con lo cual obtuvimos los siguientes
resultados (cuadro 3.4):
41
Figura 3.4 Centro de Gravedad
Cuadro 3.4 Datos para hallas el centro de gravedad
Se aplicó la siguiente fórmula:
x = Sx = 61,77
n
21
x = 2.94
y = Sy = 55.1
n
21
y = 2.62
Estos valores corresponden a un nuevo par de coordenadas que indican el centro de
gravedad. Tal lugar podría ser el nuevo emplazamiento del centro de promotores de salud.
Al compararlo con la medida anterior (mediana), observamos que la posición del centro
de gravedad tuvo un desplazamiento hacia el occidente, que en distancia real corresponde
aproximadamente a 10 metros.
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
Según Estébanez & Bradshaw (1978) el centro de gravedad tiene una serie de ventajas
“puede resultar de utilidad para estudiar el cambio o la variación de una distribución a lo
largo del tiempo”... “registra sensiblemente cualquier tipo de movimiento de los elementos
de una población”. Sin embargo como desventaja esta medida “puede en algunos casos localizarse fuera del territorio estudiado”... “no indica ninguna característica de la región” y además “no resulta sencillo interpretar los resultados”.
3.3.1.4 El centro de gravedad ponderado
Consiste en aplicar el mismo procedimiento del centro de gravedad, pero a cada uno de
los puntos se le agrega un peso igual a un valor que es intrínseco a cada uno de los datos.
¿Cómo se halla el centro de gravedad ponderado?
42
Utilizando el mismo problema, hemos decidido tener en cuenta un nuevo valor que
actuará como peso (w). Este valor corresponde al número de personas que habita en cada una
de las viviendas del área, con el fin de identificar los puntos que representan mayor demanda
del servicio de salud. Se obtuvieron los siguientes datos:
Cuadro 3.5 Datos para hallar el centro de gravedad ponderado
MADRID, A. & ORTÍZ, L.
Al localizar éste nuevo par de coordenadas (figura 3.5), observamos que en este caso el centro
de gravedad ponderado no se trasladó notoriamente con relación al centro de gravedad.
Fig. 3.5 Centro de gravedad ponderado
Podría decirse que entre las tres medidas (mediana, centro de gravedad y centro de gravedad ponderado), la diferencia es aproximadamente de 10 metros entre una y otra. En términos reales y al hacer una observación del terreno se podría afirmar que cualquiera de los tres
resultados sirve para ubicar el puesto de promotores de salud, puesto que topográficamente
no presentan ningún inconveniente (figura 3.6)
Fig. 3.6 Diferencia espacial entre medidas
3.3.2 Las medidas de dispersión
Son técnicas que analizan la disgregación de un conjunto de datos en relación con un
centro medio. Espacialmente sirven para identificar qué tan distanciados y/o concentrados se
encuentra cada uno de los puntos en relación con un centro de gravedad. Estas medidas
superan, en parte, la dificultad de las medidas de tendencia central en las que los valores
extremos modifican radicalmente los resultados; las medidas de dispersión toman todos los
datos y buscan el grado de variabilidad o esparcimiento no sólo a un centro medio, sino al
conjunto de datos puntuales.
43
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
3.3.2.1 Desviación típica
Se define estadísticamente como “el grado de dispersión absoluta de los valores respecto
a la media” (Gamir, et al. 1995).
Para hallar la desviación típica se utiliza la siguiente fórmula:
en donde: s = desviación típica
x = media de los valores de x
n = número de observaciones
En el siguiente conjunto de datos:
7, 5, 3, 4, 9, 1
x = 4,8
Ver Cuadro 3.6. Para obtener la desviación típica, se le resta a cada una de las observaciones
la media (columna 2), cada uno de estos resultados se eleva al cuadrado (columna 3) con el
propósito de evitar valores negativos, se suman y se dividen en el número de observaciones.
Finalmente se obtiene la desviación típica hallando la raíz cuadrada de éste último resultado.
44
Cuadro 3.6 Datos para hallar la desviación típica
σ=2,6
En geografía, al igual que en las medidas de tendencia central, para hallar la desviación
típica de un conjunto de datos puntuales espacializados, es necesario ubicarlos en el plano
bidimensional x e y, y básicamente aplicar la misma fórmula estadística.
La desviación típica puede obtenerse a partir de dos métodos: el gráfico y el aritmético.
¿Cómo se halla la desviación típica en un conjunto de datos espacializados?
3
Remitirse a dicho apartado.
MADRID, A. & ORTÍZ, L.
Nuestro problema a resolver es el siguiente: el puesto promotor de salud desea determinar cual es la distancia media que debe recorrer cualquiera de sus especialistas a cada una de las
viviendas ubicadas en la zona escogida. Con ello desean determinar si en un solo día es
posible realizar una campaña de vacunación, teniendo en cuenta el período de conservación
de los antivirus a utilizar.
Recordemos que el centro de gravedad es igual a: x = 2,94
y = 2,62
En la figura 3.7 aparecen señalados los trayectos de cada uno de los puntos hacia el centro
de gravedad; es decir la distancia que existe entre cada vivienda y el centro promotor de salud.
Figura 3.7 Trayecto de cada uno de los puntos al centro de gravedad. Método gráfico
En el cuadro 3.7 se registran estas distancias en la columna 2, la columna 3 corresponde
al cuadrado de las distancias.
σ=
61,49
21
σ=1,71
Cuadro 3.7 Longitud de cada uno de los trayectos al centro de gravedad
45
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
Al hacer el cálculo obtenemos una desviación típica de 1,71, que en términos reales
equivale a 171 metros, lo que significa que esta es la distancia promedio que deben recorrer
los especialistas desde el centro promotor de salud para prestar sus servicios.
La desviación típica resultante, equivale gráficamente al radio de un círculo que encierra
los puntos más cercanos al centro de gravedad, a partir de una distancia media, como se
observa en la figura 3.8
Figura 3.8 Desviación típica de las distancias. Método gráfico
46
Debe tenerse en cuenta que en la vida real sería más pertinente establecer los trayectos a
partir de las vías existentes, tanto fluviales como terrestres, puesto que no se estarían teniendo en
cuenta los obstáculos físicos que pueden aparecer. No obstante, Estébanez & Bradshaw (1978)
consideran que existen algunos hechos de carácter geográfico en los que se hace más recomendable el uso de la desviación típica, que el de algunas medidas de tendencia central. Los autores
toman como ejemplo los estudios de funciones en los que el centro de gravedad se ubica por lo
general en el centro de las ciudades. Sin embargo por sí solo éste dato representa únicamente un
punto, mientras que la desviación típica sugiere el emplazamiento de un área de influencia cuyo
tamaño está determinado por todos y cada uno de los puntos.
MADRID, A. & ORTÍZ, L.
Para aplicar el método aritmético al ejemplo anterior, utilizamos el siguiente cuadro de
trabajo:
47
Cuadro 3.8 Datos para la obtención de la desviación típica. Método aritmético
Gráficamente la diferencia no es muy notoria, ver figura 3.9
Figura 3.9 Desviación Típica de las distancias, Método Aritmético - Método Gráfico
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
Entre el resultado arrojado por el método gráfico y el método aritmético, hay una diferencia de 8 metros. Este último método es mucho más exacto, siendo por tanto más óptimo
en investigaciones que requieren mayor precisión o en aquellas en las que el número de
emplazamientos es muy grande. El método gráfico, por su parte, es útil para estudios preliminares.
3.3.2.2 Desviación típica ponderada:
Consiste en hallar el grado de dispersión absoluta respecto al centro de gravedad ponderado, pero teniendo en cuenta un peso para cada emplazamiento cuyo valor le da mayor
importancia a ciertas localizaciones puntuales que a otras.
Se denota con la letras s.w
¿Cómo se halla la desviación típica ponderada?
48
Teniendo en cuenta que el puesto promotor de salud, no cuenta con la suficiente cantidad de antivirus, se ha decidido elaborar la campaña de vacunación estableciendo prioridades
de la siguiente manera:
Prioridad 3, para las viviendas en donde habiten mujeres embarazadas y niños menores
de 1 año.
Prioridad 2, para viviendas con niños menores de 1 año.
Prioridad 1, para viviendas con población infantil en edad de vacunar.
Se le asignará el valor 0 a aquellas viviendas que no cumplan con ninguna de las condiciones anteriores.
Para facilitar el trabajo es aconsejable elaborar el siguiente cuadro y totalizar las columnas.
MADRID, A. & ORTÍZ, L.
Cuadro 3.9 Datos para la obtención de la desviación típica ponderada
El centro de gravedad ponderado está determinado por las siguientes coordenadas:
xw = 3.2
yw = 3.1
Al aplicar la fórmula, tenemos que:
En la figura 3.10 se grafica la nueva área de influencia a partir del centro de gravedad
ponderado. Obsérvese que es posible graficar el peso de cada una de las viviendas, utilizando
la variable talla4.
Figura 3.10 Desviación de las distancias Ponderadas
4
La talla es la única variable visual que desde la Cartografía Temática se ha propuesto para representar gráficamente cifras que tienen una implantación puntual.
49
ANÁLISIS DE LA DISTRIBUCIÓN ESPACIAL DE LOS DATOS
Nótese que hubo un desplazamiento en dirección Noreste, hacia las viviendas que obtuvieron mayor peso con relación a las prioridades establecidas por el puesto de promotores de
salud.
3.4 Conclusiones de capítulo
Cabe hacer algunas aclaraciones finales en cuanto a las medidas de tendencia central:
• Su aplicación es conveniente en casos que lo ameriten ya que existen fenómenos que no
solo basta localizarlos, sino que es preciso tener en cuenta algunas condiciones para ello. Ubicar por ejemplo una estación limnigráfica responde a otras exigencias, tales como el costo, la
cercanía a un río, el fácil acceso a la misma, la importancia de la corriente hídrica en cuanto a
su dinámica... etc.
• Se puede decir que este tipo de medidas se constituyen en una herramienta para el simple
análisis de localizaciones ideales o artificiales, pero no para fenómenos que tienen un comportamiento natural que no todas las veces es predecible.
50
Descargar