Universidad de Chile Facultad de Ciencias Físicas y Matemáticas Departamento de Ingeniería de Minas MI4040 Análisis Estadístico y Geoestadístico de Datos PROYECTO N°2 ANÁLISIS GEOESTADÍSTICO DE UN YACIMIENTO CUPRÍFEROARGENTÍFERO Integrantes: Héctor Toro Vega Profesor: Xavier Emery Fecha de Entrega: 13 de Abril de 2012 1 Abstract The following report deals with the study of geo-statistical variables (variables distributed in space). In order to do that, the distributions of the Copper, silver and arsenic’s grades of a Copper-Silver deposit are modeled using a dataset that contains the information of several drilling samples in the area. The analysis consisted of an exploratory data study, a variographic analysis, a cross-validation the creation of a blocks grid and estimates these variables using kriging. Almost every step of the analysis was made using the software Isatis, only the exploratory data study required the use of the software MS Excel. Using the exploratory data study abnormal, wrong and outlier data were eliminated from the database and some statistics parameters, such as the minimum, maximum, mean, standard deviation and variance. With those results at hand, it was possible to implement the variographic analysis and the cross-validation in order to establish the anisotropy of the variables and to create a blocks grid. Starting from that grid, a block kriging model was built. The model has the property of being the best linear, unbiased estimator for the variables with this dataset. 2 Resumen ejecutivo El siguiente informe trata del estudio de variables geo-estadísticas (variables distribuidas en un espacio). Para ello, se utilizan el modelamiento de las distribución de ley de concentrado de cobre, plata y arsénico en un yacimiento cuprífero- argentífero, a partir de una base de datos con la información de muestras de sondajes en la zona. El análisis constó de un estudio exploratorio de datos, análisis variográfico, validación cruzada, creación de una grilla de bloques y estimación por kriging de las variables mencionadas. Cada una de estas labores fue apoyada con el uso del software Isatis, y para el estudio Exploratorio de datos se utilizó el software MS Excel. Del análisis exploratorio de datos para las variables, donde se eliminaron datos erróneos, outliers y aberrantes y se obtuvieron los siguientes parámetros estadísticos para el cobre, la plata y el arsénico: mínimo, máximo, media, desviación estándar y varianza. Con lo obtenido, se realizaron el análisis variográfico y validación cruzada para determinar las anisotropías y finalizar con la creación de una grilla de bloques. A partir de ella se realizó el modelo de kriging de Bloques, donde se debe cumplir las condiciones de insesgo, linealidad y optimalidad, para estimar los valores de las variables en lugares que no se tenga información. 3 Tabla de contenido Abstract……………………………………………………………………………..2 Resumen ejecutivo………………………………………………………………….3 Introducción………………………………………………………………………...5 Importación de los datos en Isatis…………………………………………………..6 Estudio exploratorio de las variables……………………………………………….7 Análisis variográfico………………………………………………………………..9 Mapas Variográficos………………………………………………………………..9 Variograma experimental direccional…………………………………………...…15 Variograma modelado………………………………………………………….…..20 Grilla de bloques……………………………………………………………….…..27 Kriging en la grilla………………………………………………………………...28 Análisis de resultados………………………………………………………….…..30 Conclusiones……………………………………………………………………….34 4 Introducción En el siguiente informe se realiza un estudio geoestadístico de datos a partir de una basa de datos de un yacimiento cuprífero-argentífero ubicado en el norte de Chile, que corresponden a muestras de sondajes y canales donde se midieron distintas variables geometalúrgicas como cobre, arsénico, plata y antimonio junto a la respectiva ubicación en el espacio de donde fueron extraídas las muestras. El objetivo de este proyecto es modelar, a partir de la información obtenida de las muestras de sondajes y canales de la base de datos “Datos.xls”, la distribución de leyes de cobre, plata y arsénico del yacimiento cuprífero-argentífero. Para la solución del problema se empleará el software “Isatis.exe”, con el cual se realizará el estudio exploratorio de datos, el análisis variográfico y la posterior estimación de leyes a través de un plan de kriging. Las etapas en las que se divide el proyecto son las siguientes: 1. Importación de los datos a Isatis. 2. Estudio exploratorio y análisis variográfico de las variables (Cu, Ag y As). 3. La creación de una grilla de bloques con los siguientes parámetros: 3.1. Origen (8977.5 m, 25705 m, 2105 m). 3.2. Malla (5 m, 10 m, 10 m). 3.3. Número de nodos (33, 23, 20). 4. Plan de kriging de Cu, Ag y As en la grilla, a partir de los datos de sondajes y canales. 5. Análisis de los resultados. 5 Importación de los datos en Isatis Primero se crea el proyecto “Yacimiento CupriferoArgentifero” en Isatis, en este se crea la carpeta “Sondajes” dentro de la cual se crea el archivo “Datos de sondajes”. Se importa la base de datos “datos.xls” en el archivo “Datos de sondajes”. Se designan las variables Este, Norte y Cota como Easting (x), Northing (y) y Elevation (z) respectivamente. Como en la base de datos las variables Ag, As, Cu, Sb que no se encuentran muestreadas tienen el valor -99, entonces todas las variables que toman el valor -99 se designan como N/A en Isatis. Figura 1. Importación de datos. 6 Estudio exploratorio de los datos El estudio exploratorio corresponde al análisis de los datos desde todas sus perspectivas de manera obtener una visión generalizada de estos mediante la obtención de las medidas de tendencia central y dispersión de los datos, entre otros parámetros estadísticos; como también mediante la observación del comportamiento espacial de los datos utilizando por ejemplo histogramas, mapas base, gráficos cuantil contra cuantil, etcétera. Se tiene una base de datos de un yacimiento cuprífero-argentífero ubicado en el norte de Chile (“Datos.xls”) correspondiente a muestras de sondajes y canales en donde se midieron las leyes de cobre (Cu, medida en %), arsénico (As, medida en g/Ton) y antimonio (Sb, medida en g/Ton). Cada muestra posee además información sobre sus coordenadas geográficas Este, Norte y Cota (medidas en m) y la identificación del sondaje y/o canal (ID). Le geología del yacimiento indica que la mineralización ocurre principalmente bajo la forma de enargita (Cu3AsS3), luzonita (Cu3AsS4), tetraedrita (Cu12Sb4S13), tenantita (Cu12As4S13) y argentotenantita ((Cu,Ag)10(Zn,Fe)10(As,Sb)4S13). Detección de anomalías y errores en la base de datos 1. Datos duplicados: se eliminan las filas de datos duplicados usando el comando tools<duplicates. 2. Datos Atípicos u outliers: los datos atípicos son datos extremos en las variables a estudiar (leyes). Estos pueden ser eliminados de la base de datos o atenuados, en este caso se eliminan si es que son muy grandes en comparación con los datos vecinos observándolo a partir de los mapas bases para cada una de las variables Ag, As y Cu. 3. Datos erróneos: los datos erróneos en la base de datos se pueden identificar ya que estos son imposibles encontrarlos en la realidad, por lo que se debe a algún error en la medición o transcripción de los datos. Los datos erróneos en la base de datos “datos.xls” fueron eliminados directamente utilizando la herramienta “filtro” del software Microsoft Excel. Este 9118,89 9035,84 Norte Cota Cu As Ag Sb ID 25800,06 2233,04 0,74 60 N/A DD4960 -5 25708,54 2280,73 0,02 1900 4 DD5244C -9 Tabla 1. Filas con datos erróneos eliminadas de la base de datos. 7 Despliegue de datos La siguiente figura muestra los mapas base para las variables geometalúrgicas a estudiar, donde se aprecian zonas de mayor ley en contraste con otras de baja ley. Figura 2. Mapas base para Ag (g/Ton), As (g/Ton) y Cu (%) X0Y Estadísticas elementales Ag As Cu N° de datos Mínimo Máximo Media Varianza 5626 0,4 620 35,99 2824,33 5758 5 60000 1939,2 150202,94 5786 0,01 29,9 1,62 5,11 Tabla 2. Estadísticas elementales para Ag, As y Cu. Ag As Cu 1 0,49 0,82 Ag 0,49 1 0,77 As 0,82 0,77 1 Cu Tabla 3. Matriz de correlación para Ag, As y Cu. 8 Análisis variográfico Un análisis variográfico busca describir y modelar la continuidad espacial de una variable con el objetivo de poder descubrir presencias de anisotropías, si existen zonas de continuidad espaciales preferenciales este se verán reflejadas en el mapa, esto un estudio a priori pues las anisotropías se deben comprobar dentro de los variogramas, pero es del análisis variográfico donde se encuentran pistas . Para realizar este análisis se realizo un mapa variográfico para cada una de las leyes, donde se visualiza el variograma en todas las direcciones del espacio. Mapas Variográficos Los mapas variográficos obtenidos para cada elemento en las direcciones Este, Norte y Cota, representados por U, V y W respectivamente, utiliza los siguientes parámetros para su construcción de acuerdo a los distintos planos formados por las direcciones especificadas: Número de direcciones Número de pasos Paso (distancias) Tolerancia en la distancia Tolerancia en la dirección Número mínimo de pares de datos Plano U-V 18 10 8,3 [m] 1 paso Plano U-W 18 10 8,3 [m] 1 paso Plano V-W 18 10 12 [m] 1 paso 1 sector 1 sector 1 sector 1 1 1 Tabla 4. Parámetros de mapa variográfico Los parámetros fueron elegidos de tal manera de poder mapear al menos la mitad del plano, pues así nos aseguramos de registrar anisotropías en el caso de existir. Los ejes de referencia son XYZ o UVW, respectivamente. 9 • Cobre: Figura 3. Mapa variográfico cobre, dirección U-V Figura 4. Mapa variográfico cobre, dirección W-V 10 Figura 5. Mapa variográfico cobre, dirección W-U Para el cobre las direcciones de anisotropías no son tan claras a la vista, de hecho en el plano WV no existen, en el plano UV podría existir en la dirección N10 y su ortogonal N100, en el caso del plano WU podría existir en la dirección Z15 y Z105. 11 • Plata: Figura 6. Mapa variográfico de plata, dirección V-U Figura 7. Mapa variográfico de plata, dirección W-V 12 Figura 8. Mapa variográfico de plata, dirección W-U Para el cobre las direcciones de anisotropías no son tan claras a la vista, de hecho en el plano WV no existen, en el plano UV podría existir en la dirección N10O y su ortogonal N10, en el caso del plano WU podría existir en la dirección Z20 y Z110. 13 • Arsénico: Figura 9. Mapa variográfico de arsénico, dirección V-U Ilustración 10. Mapa variográfico de arsénico, dirección W-V 14 Figura 11. Mapa variográfico de arsénico, dirección W-U Se puede observar que no existen direcciones claras de anisotropía para el arsénico. Variograma experimental direccional A continuación se presentan los variogramas experimentales direccionales, que se realizan con el fin descartar o asegurar anisotropías, en el caso de existir estás se verán claras en el variograma y así aseguramos la existencia, en caso contrario descartamos y solamente utilizaremos el variograma omnidireccional, los parámetros utilizados fueron los siguientes: Pasos (distancias) 8,56[m] Número de pasos 10 Tolerancia en la distancia 0,5 Tabla 5. Parámetros variograma experimental direccionales Las direcciones sospechosas fueron ya descritas anteriormente y son ellas las utilizadas para calcular los variogramas. 15 • Plata: Figura 13. Variograma experimental direccional de plata, dirección U-V Figura 14. Variograma experimental direccional de plata, dirección W-U 16 • Cobre: Figura 15. Variograma experimental de cobre, dirección U-V Figura 16. Variograma experimental de cobre, dirección W-U 17 El análisis es el mismo tanto para el cobre como la plata: la sospecha no es cierta, de hecho, era de esperar pues en el mapa no eran claras las anisotropías y esto se corrobora con el variograma experimental, en ambos casos el variograma es bastante similar. Aunque pueden que difieran un poco, asegurar anisotropías sería irresponsable pues estaríamos entregando mayor información, pero falsa, al krigging lo cual puede traer errores en nuestros resultados. Por lo tanto, después de este análisis, no existen anisotropías zonales para ningún tipo de variable. Variograma experimental omnidireccional Al no existir anisotropías solamente se trabajará con los variogramas omnidireccionales y serán estos los modelados para después ser utilizados en el krigging. Los parámetros a considerar son: Pasos (distancias) 8,56[m] Número de pasos 10 Tolerancia en la distancia 0,5 Tabla 6. Parámetros variograma experimental omnidireccional • Cobre: Figura 17. Variograma experimental omnidireccional de cobre 18 • Plata: Figura 18. Variograma experimental omnidireccional de plata • Arsénico: Figura 19. Variograma experimental omnidireccional de arsénico 19 Variograma modelado Un variograma experimental es incompleto en cuanto a que se calcula sólo para algunas distancias y direcciones, y los valores obtenidos dependen directamente de los parámetros y pares de datos utilizados en su cálculo, por lo tanto es necesario ajustarlo por un modelo teórico que se adecue al variograma de la función aleatoria. A continuación se presentan los variogramas modelados para cada variable a partir de la suma de variogramas elementales (estructuras anidadas). • Plata Figura 20. Variograma modelado de plata Este variograma se encuentra anidado por un modelo de efecto pepita y un modelo esférico el cual presenta un alcance de 20,01 [m] y una meseta de 1851,79 y el efecto pepita es de 1758,73. 20 • Cobre Figura 21. Variograma modelado del Cobre Al igual que el variograma anterior, el cobre también presenta un modelo anidado del efecto pepita y el modelo esférico. El modelo esférico tiene una meseta y un alcance de 2,55 y 19,94 m respectivamente y el efecto pepita es de 3,03. • Arsénico Figura 22. Variograma modelado del Arsénico 21 A diferencia de los otros variogramas, este está modelado por efecto pepita y un modelo exponencial. Este último tiene un alcance de 38,58 m y meseta de 6.879.759,24 y el efecto pepita es de 8.227.152,75. Validación cruzada Con el objetivo de validar los variogramas modelado y la vecindad escogida se realiza una validación cruzada, es decir se estiman los datos a partir de los demás como si siguieran el comportamiento del variograma modelado, obviamente existirá un error asociado, el cual es nuestro parámetro de decisión para validar, tomamos como error una banda de 5% para ambas lados (2.5 % por lado), sobre y sub estimación, los datos en rojo en las figuras se encuentran sobre el error, y estos datos no deben superar el 5% del total de la muestra. También se deben cumplir ciertas condiciones de sesgo, precisión, los cuales son detallados a continuación, • • • • Insesgo: el promedio de los errores deber ser cercano a cero. Precisión: el valor de la varianza deber ser pequeño. Varianza de errores estandarizados debe ser cercano a uno, el variograma cuantifica adecuadamente la incertidumbre. Nube de dispersión debe acercarse a la diagonal para cumplir insesgo condicional. 22 • Plata: Figura 23. Validación cruzada de la Plata 5620 Datos Promedio Varianza Error 0,0285 2084,99 Error Std. 0,0006 0,91 Porcentaje 2.5% Tabla 7. Datos validación cruzada de la plata 23 Todas las condiciones anteriores se cumplen salvo que la varianza del error sea un valor pequeño, esto se explica pues en la nube de dispersión vemos que los valores con altas leyes fueron estimados por valores más pequeños y estos aumentan la varianza, aun así es la varianza más pequeña que se puede obtener, por lo tanto, se valida el variograma. • Cobre Figura 24. Validación Cruzada del Cobre 24 5598 Datos Promedio Varianza Error -0,0013 3,59 Error Std. -0,0006 1,01 Porcentaje 3% Tabla 8. Datos validación cruzada del Cobre Todas las condiciones anteriores se cumplen por lo tanto, se valida el variograma. • Arsénico Figura 25. Validación cruzada del Arsénico 25 5570 Datos Promedio Varianza Error -2,774 12.016.896,91 Error Std -0,001 1,14 Porcentaje 2.8% Tabla 9. Datos validación cruzada del Arsénico Todas las condiciones anteriores se cumplen salvo que la varianza del error sea un valor pequeño, esto se explica pues en la nube de dispersión vemos que los valores con altas leyes fueron estimados por valores más pequeños y estos aumentan la varianza, aun así es la varianza más pequeña que se puede obtener, por lo tanto, se valida el variograma. 26 Grilla de bloques Para realizar una estimación por kriging, es necesario definir una grilla que cubre la zona muestreada con una malla definida de un cierto tamaño, de modo que se puedan generar bloques para la cubicación del yacimiento. Para un modelo de Bloques en ISATIS, se genera la siguiente grilla de bloques utilizando los siguientes parámetros, donde se indican las coordenadas x, y, z de cada caso. Parámetros Origen Malla N° de Nodos Coordenadas Y(m) 25705 10 23 X(m) 8977,5 5 33 Z(m) 2105 10 20 Tabla 10. Parámetros grilla de bloques Para cada malla de 5m x 10m x 10m se obtuvieron gráficos de la siguiente manera: Figura 26. Vista XOZ de la Grilla del Cobre 27 Kriging en la grilla La interpolación por Kriging se realiza en ISATIS. Los modelos para el Kriging pueden ser adoptados con un soporte puntual o un soporte de bloques. Para mejor zonación, se determinó utilizar modelo de bloques. Las mallas empleadas son de 10mx10mx5m. Este método, se utilizara para las tres variables de la muestra (Cu, Ag y As). • Plata: Figura 27. Base kriging de la Plata, Vista X0Y y X0Z para estimación de leyes y desviación std. 28 • Cobre: Figura 28. Base kriging del Cobre, Vista X0Y para estimación de leyes y desviación std. • Arsénico: Figura 29. Base kriging del Arsénico, Vista X0Y para estimación de leyes y desviación std. 29 Análisis de Resultados Con el objetivo de validar el kriging es fundamental realizar ciertos análisis, como que la variable siga comportándose de acuerdo a su distribución, que la media siga siendo la misma y el comportamiento por dirección sea el mismo. Se sabe que el kriging subestima las altas leyes y sobre estima las bajas leyes, por lo tanto veremos que en las zonas de alta concentración, que no son muchas, existirá una atenuación y en las zonas de baja ley aumentarán un poco, sin embargo la media debería ser bastante similar. • Plata: Analizando primero las estadísticas básicas se observa que la media es bastante similar, 36.71 contra 32.17, el número de muestras obviamente aumenta pues en el segundo caso se estima para toda la malla. Efectivamente el máximo es menor bajando de 855 a 841 [gr/t] , y en ambos casos el comportamiento se mantiene pues ambas curvas son de la misma forma en el QQPlot. 30 Para el caso de las leyes contra las direcciones espaciales, el kriging de cierta manera compacta a los valores altos y aumenta los valores bajos pero no de la misma manera, pues aun cuando ocurre esto las tendencias se mantienen, viendo por ejemplo los gráficos siguientes, se observa que las zonas donde existían máximos siguen siendo las mismas. 31 • Cobre: En el caso del sobre el análisis es similar al de la plata y las medias también se mantienen, en el caso del comportamiento de la variable frente a una distribución normal (gráficos QQPLOT), la variable después del kriging sigue manteniendo ese efecto curva pero se atenuó en las bandas, su comportamiento es más parecido a una distribución normal que log-normal, pero para aseverar tal hipótesis es necesario hacer un test estadístico. 32 Para el caso de las leyes versus las direcciones espaciales se comprueba que las tendencias se mantienen mayoritariamente y los efectos del kriging se producen. Para el cobre las altas leyes fueron más atenuadas que en el casa de la plata. 33 Conclusiones A partir del estudio exploratorio de datos se puede concluir que es de primordial necesidad hacer una limpieza de la base de datos, eliminando outliers, duplicados, datos incoherentes y datos repetidos, pues al haber dejado estos en la base, el resultado habría distado mucho del actual. Isatis en primera instancia entregó unos mapas bases de la distribución de leyes de las muestras en el espacio, estos mapas dieron una idea principal de la localización del cuerpo mineralizado de mayor ley, la cual coincidió con la localización final entregada por el kriging, es decir, el análisis básico puede dar nociones de las distribuciones de leyes en el espacio a gran escala, si se necesitara para un estudio menor, pero no para la distribución continua de leyes que da el kriging. Luego se continúo con el análisis variográfico, tanto de mapas como de variogramas, este paso es un fundamental pues es la herramienta matemática que alimenta al kriging, y sobre en este caso cuando la media de la población es desconocida. El análisis fue más bien conservador, pues en el momento de buscar anisotropías en los mapas estás nunca se presentaron claras y se decidió validar o rechazar tales hipótesis con los variogramas experimentales, en ningún caso se encontró direcciones preferenciales por lo tanto se procedió a trabajar con los variogramas experimentales. Esta tarea es relativamente fácil pues el Isatis entrega bastantes herramientas para modelar, en todos los casos se utilizaron dos modelos, el efecto pepita y esférico o exponencial con los valores señalados dentro del informe. Una vez hecho esto, la validación cruzada entregó resultados positivos de sobre nuestros variogramas cumpliendo con todas las condiciones. Por lo tanto los variogramas modelados de las variables son insesgados y precisos, más aún cuántica adecuadamente la incertidumbre y no existe sesgo condicional. Finalmente para obtener la interpolación espacial es necesario crear una grilla de bloques, esto se hizo para cada variable por separado pues se tiene los variogramas por separado, luego se agrega todo esta información al kriging, manteniendo la vecindad móvil utilizada para los variogramas. Las estadísticas básicas pre y post kriging se detallan a continuación, Pre Post Cu Media 1,66 1,74 Min 0,01 0,13 Max 29,9 17,84 Datos 5590 15180 Pre Post Ag Media 36,71 32,17 Min 0,4 2,16 Max 855 31,74 Datos 5438 15168 34 Pre Post As Media 1984,66 2257342 Min 5 14,72 Max 68340 22722 Datos 5570 15168 Se observan claramente los efectos del kriging, los mínimos aumentaron y los máximos disminuyeron, las medias son relativamente iguales. El kriging finalmente permite tener una continuidad en las leyes espaciales a partir de modelos de bloques y con esto es posible poder estimar la cantidad de recursos totales del yacimiento con la ley crítica, los bloques superando esa ley crítica serán rentables y luego es el trabajo del planificador decidir el orden en el que se extraen. 35