El Modelo Condicional de Predicción de Outliers en la

Anuncio
El Modelo Condicional de Predicción de
Observaciones Extremas en la reconstrucción de
Territorios del Tejón Eurosiático (Meles meles)
Martı́n Alfredo Legarreta-González*, Paul G. Blackwell**
Resumen
Los tejones euroasiáticos son animales que defienden sus territorios, no sólo con agresión
directa sino que, además, usan varios tipos de señales visibles para delimitarlos (e.g. letrinas).
Existe una técnica usada ampliamente para determinar la configuración de estos territorios
conocida como bait-marking. La idea básica es dar marcadores plásticos, mezclados con alimento, a los tejones y registrar el lugar en dónde son recuperados, después de su excreción,
anotando las coordenadas cartesianas de la letrina en un mapa, ası́ como el grupo social al
que pertenece y su número de retornos. Las letrinas se pueden clasificar en dos grupos: las
que se encuentran en el territorio del grupo social en estudio, y excursiones extraterritoriales
(observaciones extremas). El Modelo de Predicción de Observaciones Extremas (OPM, por sus
siglas en inglés) propuesto por Elstub y Etherington, hace uso de regresión logı́stica para estimar la probabilidad de que una letrina es una observación extrema, basado en la localización
de todas las letrinas observadas y otras covariables relevantes. Hemos buscado mejores formas
en la construcción de covariables del OPM que las usadas por Elstub, usando el Criterio de
Información de Akaike (AIC) para seleccionar el modelo más adecuado. Dimos una extensión
Bayesiana del OPM —Modelo Condicional de Predicción de Observaciones Extremas (COPM,
por sus siglas en Inglés) — que puede estimar probabilidades conjuntas dado el estado de letrinas vecinas y, combinado con el método de Polı́gonos Convexos Mı́nimos —que, usado solo,
tiende a sobreestimar territorios— nos permite reconstruir los territorios, cuantificando la incertidumbre presente en sus fronteras, esto porque este modelo condicional puede, entonces,
ser usado dentro de una aproximación de Muestreo de Gibbs. Nuestra extensión es condicional
en el sentido de que intentamos modelar si una letrina es una observación extrema dado el
estado de las letrinas vecinas (asociadas con el mismo territorio y en la misma dirección) es, en
efecto una observación extrema. Nuestra aproximación permite dar una descripción de la incertidumbre en la recuperación de territorios (y no sólo una estimación puntual) que puede ser
de ayuda en el manejo de las poblaciones de tejones por los ecólogos, lo cual es muy importante
en el Reino Unido debido a que el tejón euroasiático es un reservorio de la tuberculosis bovina
y, en este momento, existe el debate sobre la autorización de la reducción de su población
sacrificándolos.
* PhD in Probability and Statistics candidate, University of Sheffield, UK, Docente Universidad Autónoma de
Chihuahua, México
** Professor, School of Mathematics and Statistics, University of Sheffield, Sheffield, UK
1
§1
1.1.
Introducción
Etiologı́a
Durante décadas el tejón euroasiático (Meles meles) ha sido sujeto de estudio tratando de explicar su primitiva organización social, alimentación, territorio y, últimamente, su relación con la
tuberculosis bovina. Los tejones son animales que pasan el dı́a durmiento en sus madrigueras y
se alimentan durante la noche. Viven en clanes, compartiendo y defendiendo un territorio común,
pero buscan su alimento de manera solitaria.
1.2.
Reconstrución de Territorios del Tejón Euroasiático
Se han hecho varios intentos para explicar el tamaño y configuración de los territorios de los
tejones, por ejemplo, que dependen de los recursos disponibles o de la localización de la madriguera
principal. Ya que los tejones usan letrinas comunales para marcar sus territorios, los métodos
estadı́sticos para delinear sus territorios, basados en esta información, son muy comunes. Una
de las técnicas más usadas para determinar la configuración territorial de grupos sociales del
tejón europeo, es la conocida como bait-marking, la cual tiene aplicaciones tanto en investigaciones
ecológicas ası́ como de manejo o administración de vida salvaje. La técnica consiste en dar pequeños
piezas plásticas, de diferente forma y/o color, a cada clan, mezcladas con alimento, registrando en
dónde son recuperadas después de su excresión. Ya que, como se mencionó anteriormente, los tejones
marcan sus territorios con letrinas comunales, lo que hace que este técnica sea la idónea para este
tipo de investigación, además de que permite estimar los lı́mites territoriales entre diferentes grupos
sociales de tejones.
1.2.1.
Métodos usados en la reconstrucción de territorios de tejones
Una aproximación para delinear territorios de tejones es considerar varios terriotrios a la vez. Este
método traza polı́gonos en los que su centro puede ser la madriguera o su centro geométrico. En este
modelo, las letrinas siguen los bordes de una tesala de Dirichlet. Con este método, los territorios
rodeados por otros tienen una buena estimación; sin embargo, debido a información incompleta
cerca de los bordes del área de estudio, las fronteras en estos terriorios son indeterminadas. El
considerar la madriguera como el centro del territorio no mejora el modelo aunque, si se diferencia
entre tipos de letrinas (intra-territoriales y de frontera) éste mejorarı́a.
Otra forma de reconstruir estos territorios, es considerar un territorio a la vez. El método más
usado es el de Polı́gonos Convexos Mı́nimos (MCP, por su siglas en inglés), en el que las letrinas
perimetrales son unidas para determinar el territorio. Una segunda aproximación consiste en modelar la localización de las letrinas usando información del hábitat o estructuras cercanas a ellas para
reconstruir el territorio. Por último, el Modelo de Predicción de Observaciones Extremas (OPM),
que intenta predecir si una determinada letrina es una excursión extraterritorial (Outlier) o no,
basado en covariables relevantes que incluyen propiedades de la misma letrina y la configuración
de otras letrinas asociadas con el mismo grupo social.
1.3.
El Modelo Condicional de Predicción de Observaciones Extremas
(COPM)
Hemos buscado mejores formas para la construcción de covariables para modelos tipo OPM (variando la magnitud del ángulo y la distancia mı́nima en la obtención de las variables calculadas) que
2
estimen la probabilidad de que una determinada letrina pertenece o no al territorio, basados en covariables y, usando un modelo de regresión logı́stica. El criterio de información de Akaike (AIC) fue
usado para seleccionar el modelo más adecuado. Además, dimos una extensión Bayesiana al OPM
—a la cual llamamos ’Modelo Condicional de Predicción de Observaciones Extremas’ (COPM )—
que puede estimar probabilidades conjuntas, dado el estado de letrinas vecinas y, combinado con el
método de Polı́gonos Convexos Mı́nimos —el cual, usado solo, tiende a sobreestimar territorios—
nos permite reconstruir los territorios, cuantificando la incertidumbre presente en sus fronteras,
esto porque este modelo condicional puede, entonces, ser usado dentro de una aproximación de
Muestreo de Gibbs. Nuestra extensión es condicional en el sentido de que intentamos modelar si
una letrina es una observación extrema, dado si, el estado de las letrinas vecinas (asociadas con el
mismo territorio y en la misma dirección) es, en efecto, una observación extrema. Nuestra aproximación permite dar una descripción de la incertidumbre en la recuperación de territorios y no sólo
una estimación puntual.
§2
2.1.
Métodos
Datos
Hemos usado datos otorgados por la Agencia de Investigación en Alimentos y Ecologı́a (FERA),
obtenidos del estudio de levantamiento de información de letrinas de tejones en el Parque Woodchester, al suroeste del Reino Unido, del año 2010, el cual consiste en dos fuentes de información:
a) Mapa del parque mostrando las madrigueras cebadas, las letrinas en las que se recuperaron los
marcadores plásticos, lı́neas uniendo a estas dos y, finalmente, una reconstrucción del territorio
propuesto por los investigadores del parque. b) Dos bases de datos, la primera con información de
identificación de cada letrina, número de retornos a ésta de cada grupo social que hizo uso de ella,
ası́ como sus coordenadas cartesianas y, la segunda con el nombre de la madriguera cebada y sus
coordenadas cartesianas.
2.2.
Variables
De la información proporcionada por FERA, calculamos: La distancia de la madriguera a la letrina
(di ) , Número de retornos (Ri ) , y si la letrina era compartida o no (Si ) . Con esta información
creamos dos tipos de variables: no condicionales y condicionales, en las que las letrinas usadas
para calcular su valor, están comprendidas en un ángulo de 36◦ , a las cuales llamamos ”letrinas
vecinas” de la letrina en cuestión (li ) . Dentro de las primeras tenemos dos variables: a) Media de
las letrinas vecinas de li (LDMi ) y b) Ajuste Angular (Angf iti ) , el cual es una medida de cómo
la distancia de li a su madriguera se compara con el promedio de sus letrinas vecinas, siempre y
cuando éstas estén a 140m o más de la madriguera. Si li no tiene letrinas vecinas, Angf iti toma
un valor de uno. Su fórmula es:
di
X
Angf iti =
1
dj
ni
j∈Si
Para calcular el valor de las variables conditionales no se utilizan las letrinas consideradas excursiones extraterritoriales; dentro de éstas tenemos a) suma de las distancias letrinas vecinas a la
madriguera (SDLi ) y suma de las diferencias cuadradas de las distancias de letrinas vecinas de
li a la medriguera (SDDi2 ) . Un ejemplo de una letrina se muestra en la figura 1
3
§3
3.1.
Resultados
Modelo
(
Ij =
0
1
= Letrinasquef ormanpartedelterritorio
= Excursionesextraterritoriales(ObservacionesextremasoOutliers)
X
logit(P (Ii = 1)|Ij , 6= i) = αi +
βij
i∼j
donde:
αi = c + a(di ) + b(Ri ) + e(Si ) +
1
ni
di
X
+f ·
dj
1 X
·
dj
n i∼j
j∈Si
βi∼j = g(di + dj ) + h(di − dj )2
Este modelo consiste en dos partes: La parte no condicional (αi ) en la cual el valor de las variables
es calculado usando todas las li vecinas. Las variables incluidas son: di , Ri , Si , Angf iti y LDMi
y la parte condicional (βij ) que incluye las variables (SDLi ) y (SDDi2 ) .
El modelo sólo permite interacciones dentro de cada una de sus partes (αi yβij ) . Hicimos uso de
Cadenas de Markov-Montecarlo (MCMC) para cada li con probabilidades de transición dependientes en las covariables a partir de regresión logı́stica. La inferencia se realizó vı́a un muestreo
de Gibbs, ciclando las iteraciones a través de cada letrina. Los pasos consitieron en:
1. Recorte del 50 % de las iteraciones (burning)
2. ’Adelgazamiento’ de la muestra (thinning) para evitar autocorrelaciones
3. Aplicaciı́on del MCP 100 % a cada iteración restante
4. Graficado de los resultados despés de aplicar los 3 pasos anteriores. La figura 2 es un ejemplo
de una reconstrucción de uno de los territorios aplicando nuesta metodologı́a
Latrine 7
Colliers
800
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
400
●
●
●
●
●
●
*
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
200
●
200
●
●
●
●
700
●
●
600
●
●
●
●
●
600
*
400
600
●
Latitud+380000
●
Latitud+380000
●
800
800
Latrine 7
●
●
●
●
●
●
●
3400
3600
Longitud+200000
Sett Colliers Mean
2800
3000
3200
3400
3600
Longitud+200000
Sett Colliers Conditionals
Latrine 7
800
●
●
●
500
3200
Latitud+380000
3000
●
●
●
●
●
400
2800
●
●
●
●
●
●
●
●
600
*
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
400
●
●
200
Latitud+380000
●
300
●
●
●
●
●
●
200
●
●
●
●
●
Latrines
Baited sett
●
2800
3000
3200
3400
2800
3600
Longitud+200000
Sett Colliers Angular fit
2900
3000
3100
3200
3300
3400
3500
Longitud+200000
Figura 1: Variables calculadas
(COPM)
Figura 2: Reconstrucción del Territorio ’Colliers’ usando el COPM
4
Descargar