Instituto Politécnico Nacional Caracterización y predicción

Instituto Politécnico Nacional Centro de Investigación en Computación Secretaría de Investigación y Posgrado Caracterización y predicción espacio-temporal de patrones delictivos mediante modelos lógico-combinatorios. TESIS QUE PARA OBTENER EL GRADO DE MAESTRO EN CIENCIAS DE LA COMPUTACIÓN PRESENTA ING. MIL. VÍCTOR MANUEL MARTÍNEZ HERNÁNDEZ DIRECTORES DE TESIS: DR. SALVADOR GODOY CALDERÓN DR. FRANCISCO HIRAM CALVO CASTRO MÉXICO, D.F., DICIEMBRE, 2009. I II III Resumen En este trabajo es presentada una nueva metodología para Análisis y Predicción Delictiva, basada en técnicas de aprendizaje inductivo empleado comúnmente en el área de Reconocimiento de Patrones. La metodología para Análisis Delictivo se basa en la construcción de definiciones inductivas para cada familia delictiva registrada dentro de un conjunto de datos delictivos; con base en esas definiciones, es posible determinar el comportamiento de la actividad delictiva dentro de un espacio-tiempo seleccionado. Posteriormente, se predice la cantidad de hechos delictivos que se espera ocurran, para cada una de estas familias delictivas, dentro de todas las áreas de una región en estudio. Los resultados así obtenidos prestan un valioso apoyo para la toma de decisiones de seguridad pública, permitiendo mejorar la planificación de rutas de patrullaje y la optimización en la asignación de recursos humanos y / o recursos financieros en esas zonas (y horarios) de mayor incidencia criminal. IV Abstract A new methodology, for crime-analysis and criminal activity forecast, based on inductive learning techniques commonly used in pattern recognition is presented. First, the proposed crime-analysis methodology is based upon the construction of inductive-definitions for each type of criminal family previously registered in a crime dataset. Based on these definitions, it is possible to determine the crime behavior within selected space and time frames; afterwards, a specific criminal activity forecast is constructed for all areas within the region under study. The results thus obtained provide valuable support for the public-security decision making process by allowing decision makers to better plan surveillance patrols and to optimize the use of human and /or financial resources on those areas (and times) of highest criminal incidence. V Agradecimientos "Lo poco que he aprendido carece de valor, comparado con lo que ignoro y no desespero en aprender." René Descartes Agradezco a Dios por bendecirme con la vida y permitirme llegar hasta este momento rodeado de gente maravillosa. Agradezco enormemente a mi familia, fuente constante de inspiración, amor y cariño. Todo lo que soy se lo debo a ustedes. Agradezco de manera muy especial a mis directores de tesis, Dr. Salvador Godoy Calderón y Dr. Francisco Hiram Calvo Castro, así como, al Dr. Marco A. Moreno Armendáriz, por todo el apoyo y confianza depositada en mí durante la realización de este trabajo; pero sobre todo por su amistad, que va mas allá del conocimiento y que se lleva de por vida. Agradezco a los miembros de mi comité tutorial Dr. Sergei Pavlovich Levachkine, Dr. Ricardo Barrón Fernández y al Dr. José Matías Alvarado Mentado, por sus valiosas aportaciones, las cuales me permitieron ver el problema desde diferentes ángulos y lograr con ello el desarrollo de este proyecto. Agradezco a todo el personal administrativo de este centro de estudios y de manera muy especial al Departamento de Tecnologías Educativas, quienes están constantemente en mis oraciones. Aquellas personas con lo que compartí momentos especiales y que me han brindaron su amistad incondicional: Adriel, Benja, Bryan, Ceci, Chirbuso, Cynthia, Fer, Jesús, Jeanine, Jenny, Jimmy, Juan, Lily, Mayra, Miguel, Sam, Gaby, Stefi, Gil, Richard, U.V.A., así como, a los demás compañeros de este centro de investigación. A mis amigos de toda la vida: Tania, Miriam, Tocayo y Claudia. Agradezco al Instituto Politécnico Nacional (IPN), al Centro de Investigación en Computación (CIC), al Consejo Nacional de Ciencia y Tecnología (CONACyT) y a la Secretaria de Investigación y Posgrado (SIP-IPN), por todo el apoyo otorgado durante la realización de este trabajo. Agradezco a la Secretaria de la Defensa Nacional (SEDENA), por la beca de estudios otorgada para la realización de estudios de posgrado en esta importante institución. VI Contenido Resumen ............................................................................................................................................ IV Abstract .............................................................................................................................................. V Agradecimientos ............................................................................................................................... VI Glosario de Términos ......................................................................................................................... X Lista de Figuras y Tablas .................................................................................................................. XI CAPÍTULO UNO Introducción ...................................................................................................... 1 1.1 Contexto y Antecedentes ......................................................................................................... 2 1.2 Planteamiento del Problema .................................................................................................... 3 1.3 Objetivos ................................................................................................................................. 4 1.3.1 Objetivo General ............................................................................................................. 4 1.3.2 Objetivos Específicos ...................................................................................................... 4 1.4 Contribuciones ........................................................................................................................ 5 1.5 Trabajos publicados................................................................................................................. 6 1.6 Organización de la Tesis ......................................................................................................... 6 CAPÍTULO DOS Estado del Arte .................................................................................................. 8 2.1 Criminalística y Criminología ............................................................................................... 10 2.1.1 Criminalística ................................................................................................................ 10 2.1.2 Criminología ................................................................................................................. 10 2.2 Análisis Delictivo .................................................................................................................. 11 2.2.1 Tipos de Análisis Delictivo ........................................................................................... 12 2.2.2 Análisis Delictivo en México ........................................................................................ 13 2.2.3 Sistemas de Análisis Delictivo en el Mundo ................................................................. 17 2.2.3.1 STAC (Spatial and Temporal Analysis of Crime, 1988)............................................... 18 2.2.3.2 CrimeLink (PCI Precision Computing Intelligence 1993)............................................ 19 2.2.3.3 CrimeView (Omega Group 1992)................................................................................. 21 2.2.3.4 ArcGis (Extensión para Análisis Delictivo 2000) ......................................................... 22 2.2.3.5 A.T.A.C (Automated tactical analysis of Crime 2004) ................................................. 24 2.3 Conclusión.............................................................................................................................. 27 CAPÍTULO TRES Marco Teórico ............................................................................................... 28 3.1 Soporte a la toma de decisiones ................................................................................................. 29 3.2 Reconocimiento de Patrones ...................................................................................................... 30 3.2.1 Enfoques en reconocimiento de Patrones ............................................................................. 30 3.2.2 Enfoque Lógico Combinatorio ............................................................................................. 31 3.2.3 Enfoque Estadístico .............................................................................................................. 32 3.3 Aprendizaje Inductivo ................................................................................................................ 34 3.3.1 Algoritmos tipo KORA ....................................................................................................... 35 3.3.2 Algoritmo CR (Conjuntos Representantes) ....................................................................... 37 3.4 Predicción ................................................................................................................................... 39 3.4.1 Series de Tiempo ................................................................................................................. 39 CAPÍTULO CUATRO Análisis y Predicción delictiva. ............................................................. 43 4.1 Modelo de Análisis Delictivo ................................................................................................... 45 4.1.1 Universo de Estudio .......................................................................................................... 45 4.1.2 Proceso de Aprendizaje ..................................................................................................... 45 4.1.2.1 Construcción de una Clasificación de Referencia. ........................................................ 46 4.1.2.2 Construcción de definiciones inductivas. ...................................................................... 46 4.1.2.3 Construcción de una definición neutra. ......................................................................... 48 VII 4.1.2.4 Interpretación ................................................................................................................ 50 4.2. Predicción ............................................................................................................................... 51 4.2.1. Selección de la unidad espacio-temporal a predecir........................................................ 51 4.2.2. Análisis Histórico ............................................................................................................ 51 4.2.3. Análisis del los 12 últimos meses.................................................................................... 52 4.2.4. Predicción Final............................................................................................................... 52 CAPÍTULO CINCO Resultados experimentales ............................................................ 54 5.1 Universo de Estudio .................................................................................................. 55 5.1.1 Sacramento, California, E.U.A. ............................................................................... 55 5.1.2 Consideraciones importantes sobre la base de datos ............................................... 56 5.2 Análisis Delictivo (Experimento 1) ........................................................................... 58 5.2.1 Objetivo del experimento 1 ................................................................................ 58 5.2.2 Construcción de una clasificación de referencia ...................................................... 58 5.3 Predicción delictiva (Experimento 2, 3 y 4) .............................................................. 62 5.3.1 Experimento 2 .................................................................................................... 62 5.3.1.1 Objetivo del experimento 2 ............................................................................... 62 5.3.1.2 Selección de la unidad espacio-temporal a predecir ......................................... 62 5.3.1.3 Análisis Histórico .............................................................................................. 62 5.3.1.4 Análisis del los 12 últimos meses ..................................................................... 63 5.3.1.5 Predicción Final ................................................................................................ 63 5.3.1.6 Evaluación del experimento 2 ........................................................................... 63 5.3.1.7 Conclusiones del experimento 2 ....................................................................... 66 5.3.2 Experimento 3 ............................................................................................................ 66 5.3.2.1 Objetivo del experimento 3 ............................................................................... 66 5.3.2.2 Análisis Histórico .............................................................................................. 66 5.3.2.3 Evaluación del experimento 3. .......................................................................... 66 5.3.2.4 Conclusiones del experimento 3 ....................................................................... 67 5.3.3 Experimento 4 ............................................................................................................ 67 5.3.3.1 Objetivo del experimento 4 ............................................................................... 67 5.3.3.2 Evaluación del experimento 4 ........................................................................... 67 5.3.3.3 Conclusiones del experimento 4 ....................................................................... 68 5.3.4 Experimento 5 ............................................................................................................ 68 5.3.4.1 Objetivo del experimento 5 ............................................................................... 68 5.3.4.2 Consideraciones especiales ............................................................................... 68 5.3.4.3 Análisis del los 12 últimos meses ..................................................................... 68 5.3.4.4 Predicción Final ................................................................................................ 69 5.3.4.5 Predicción bayesiana ......................................................................................... 70 5.3.4.6 Evaluación del experimento 5 ........................................................................... 70 5.3.4.7 Conclusiones del experimento 5 ....................................................................... 71 CAPÍTULO SEIS Desarrollo de Aplicación. .................................................................. 72 6.1 Arquitectura cliente-servidor ..................................................................................... 74 6.2 Base de Datos ............................................................................................................ 75 6.2.1. Diseño de la Base de Datos. ............................................................................... 75 6.2.2. Implementación de la Base de Datos. ................................................................ 76 6.3 Módulos de la aplicación ........................................................................................... 77 VIII 6.3.1. Módulo de inicio de aplicación ............................................................................... 78 6.3.2. Módulo para el Análisis Delictivo .......................................................................... 79 6.3.3. Módulo para la predicción delictiva ....................................................................... 81 6.3.4. Requerimientos de implementación de la aplicación.............................................. 84 CAPÍTULO SIETE Conclusiones y trabajo futuro. ...................................................... 85 7.1 Conclusiones................................................................................................................... 86 7.2 Aportaciones ................................................................................................................... 88 7.3 Trabajo futuro ................................................................................................................. 89 Referencias bibliográficas .................................................................................................... 90 IX Glosario de Términos Análisis Delictivo. El conjunto de procesos y análisis sistemáticos dirigidos a proveer información oportuna y pertinente relativa a hechos y correlaciones de tendencia delictiva a el personal operativo y administrativo durante la planeación de acciones tendientes a prevenir y evitar actividades delictivas, ayudar en los procesos de investigación, incrementar la aprensiones de delincuentes, asignación de recursos y esclarecer los casos. Criminalística. La Criminalística es una ciencia penal auxiliar, que mediante la aplicación de sus conocimientos, metodología y tecnología, descubre y verifica científicamente la existencia de un hecho presuntamente delictuoso y a los responsables, aportando las pruebas a los órganos que procuran y administran justicia. Criminología. Ciencia social que estudia la naturaleza, extensión y causas del crimen; características de los criminales y de las organizaciones criminales; problemas de detención y castigo de los delincuentes; operatividad de las prisiones y de otras instituciones carcelarias; rehabilitación de los convictos, tanto dentro como fuera de prisión, y la prevención del delito. Sistema de Información Geográfica (SIG o GIS, en su acrónimo en inglés). es una integración organizada de hardware, software y datos geográficos diseñado para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y gestión. Sistema soporte para la toma de decisiones (SSD o DSS en su acrónimo en inglés). Es un sistema de información basado en un computador interactivo, flexible y adaptable, especialmente desarrollado para apoyar la solución de un problema de gestión no estructurado que mejorar la toma de decisiones. Utiliza datos, proporciona una interfaz amigable y permite la toma de decisiones en el propio análisis de la situación. Sitio Web. Conjunto de páginas Web, típicamente comunes a un dominio de Internet o subdominio en la World Wide Web en Internet. X Lista de Figuras y Tablas Figura 1. Sistema STAC .................................................................................................... 19 Figura 2. Matriz de asociación de CrimeLink ................................................................... 20 Figura 3. Rueda de análisis de patrones ............................................................................ 21 Figura 4. Análisis de llamadas de CrimeLink ................................................................... 21 Figura 5. Sistema CrimeView ........................................................................................... 22 Figura 6. Análisis de focos rojos delictivos (hot spots) de ArcGis ................................... 23 Figura 7. Cálculo de la dirección del delito ....................................................................... 24 Figura 8. Análisis de series de tiempo en el sistema A.T.A.C. ......................................... 25 Figura 9. Integración del sistema A.T.A.C. con Google Earth. ........................................ 26 Figura 10. Análisis de hot spots de A.T.A.C. ..................................................................... 26 Figura 11. Análisis densidad de A.T.A.C. .......................................................................... 27 Figura 12. Vehículos robados durante el 2008 en un Sector de Vigilancia de la ciudad de Sacramento, California, E.U.A ............................................................................................. 39 Figura 13. Mapa de Sacramento, California E.U.A............................................................. 55 Figura14. División Territorial por sectores de vigilancia de la ciudad de Sacramento, california, E.U.A................................................................................................................... 57 Figura 15. Arquitectura cliente-servidor empleada ............................................................. 74 Figura 16. Modelo entidad-relación de la aplicación informática desarrollada .................. 76 Figura 17. Módulo integrador.............................................................................................. 79 Figura 18. Parámetros de entrada y salida del módulo de Análisis Delictivo. .................... 80 Figura 19. Parámetros de entrada y salida del módulo de predicción delictiva. ................. 83 Tabla 1 Definiciones Inductivas ...................................................................................... 49 Tabla 2 Octantes horarios ................................................................................................ 59 Tabla 3 Familias delictivas y sus patrones ...................................................................... 59 Tabla 4 Umbrales empleados en la construcción de definiciones inductivas. ................ 60 Tabla 5 Número de propiedades espacio-temporales características positivas y negativas encontradas. .......................................................................................................................... 61 Tabla 6 Espacio-tiempos afectados por la mayoría de las familias delictivas ................ 62 Tabla 7 Predicción realizada sobre enero del 2009 ......................................................... 64 Tabla 8 Predicción realizada sobre febrero del 2009 ...................................................... 64 Tabla 9 Predicción realizada sobre marzo del 2009 ........................................................ 65 Tabla 10 Predicción realizada sobre abril del 2009 ........................................................... 65 Tabla 11 ECM general para cada uno de los meses predichos. ......................................... 66 Tabla 12 ECM obtenido al reducir la cantidad de años en la base de datos de referencia 67 Tabla 13 ECM obtenido al no considerarse el análisis histórico....................................... 67 Tabla 14 ECM obtenido de cada uno de los algoritmos de predicción propuestos ........... 70 Tabla 15 Número de delitos predichos por cada algoritmo para el mes de enero del 2009 en el Sector de Vigilancia 3A ............................................................................................... 71 Tabla 16 Aportaciones realizadas a dos algoritmos clásicos de aprendizaje. ................... 88 XI CAPÍTULO UNO Introducción Se describe la problemática de inseguridad pública que actualmente vive México, así como la aportación del presente trabajo de tesis en esta materia. 1 Capítulo Uno 1.1 Introducción Contexto y Antecedentes El índice de criminalidad en México ha presentado un crecimiento preocupante durante los últimos años. El aumento de la delincuencia en el país ha sido de tal magnitud, que ha ocasionado un fuerte sentimiento de inseguridad entre la población, particularmente en la del Distrito Federal y en otras ciudades como Ciudad Juárez, Tijuana, Monterrey, Michoacán, etc. Este fenómeno, no sólo afecta el patrimonio y la integridad física de las personas, sino también conlleva un deterioro en el estado de derecho, desalienta la inversión, principalmente la de largo plazo, debilita la base competitiva del sector productivo nacional y, por ende, disminuye el potencial de crecimiento económico del país [Coparmex, 2002]. Dado que entre las características inherentes a la existencia de un estado de derecho está el adecuado control de las actividades delictivas, es fundamental que las autoridades lleven a cabo un combate eficaz a la delincuencia, con el fin de mantener un ambiente institucional que propicie la competitividad y el progreso de México. Actualmente la seguridad pública y el combate a la delincuencia constituyen una de las mayores preocupaciones sociales no sólo en México sino en todas las grandes ciudades del mundo. A pesar de la enorme cantidad de recursos, tanto humanos como materiales, que los gobiernos destinan a este rubro, aún resulta evidente la necesidad de mecanismos alternativos que permitan volver más eficaz y más eficiente el trabajo de las fuerzas policiacas. Una de las principales variables que limitan la eficacia y eficiencia de dicho trabajo es el tiempo de respuesta a los acontecimientos delictivos. Inclusive los mayores esfuerzos en la creación y administración de cuerpos especiales denominados de “reacción inmediata” evidencian que la ganancia marginal en ese aspecto siempre resulta insuficiente, tanto para disminuir el índice delictivo general de la zona, como para modificar sustancialmente la sensación de inseguridad entre los ciudadanos. Durante muchos años, las fuerzas policíacas se han concentrado en atender los delitos una vez que éstos se han cometido. Los delitos son tratados como episodios a ser detectados y, si de ahí resulta una aprehensión, se dice que el asunto está resuelto. Esta forma de combatir a la delincuencia es completamente errónea, que sorprende que no existan reclamos por parte de la sociedad. Es necesario que en la actualidad el combate a la delincuencia se realice con un enfoque distinto tendiente a la prevención en vez de la reacción [Arango, 2006]. Cuando los ciudadanos consideran las causas que ocasionan los delito, se tiende a hablar de ellas como si fueran temas o asuntos distantes que no pueden ser cambiados rápidamente y, por ello, se espera a que las autoridades vayan actuando, poco a poco, para que dicha situación se vaya corrigiendo. Bajo este enfoque, se descuidan las causas más inmediatas, 2 Capítulo Uno Introducción aquellas que a menudo se pueden modificar con relativa facilidad y sobre las cuales es posible influir de forma rápida y oportuna, así, no es una exageración señalar que las acciones efectivas en el combate a la delincuencia, están alrededor de nosotros, la mayoría de las veces al alcance de la mano, y que sólo esperan a ser descubiertas. Una mejor perspectiva de la situación se logra si se transporta el problema al ámbito de la prevención en lugar del de la reacción. Si las fuerzas del orden público fueran capaces de anticipar cuándo y dónde se verá incrementada la actividad delictiva de algún tipo específico, se lograría un beneficio doble. Por una parte, sería posible concentrar los recursos y actividad logística necesarios para combatir ese tipo específico de actividad delictiva en la zona y tiempo anticipados. Por otra parte, se podría establecer, de manera dinámica pero bien fundamentada, varios de los parámetros comunes del trabajo cotidiano en seguridad pública como el diseño específico de rondas de vigilancia, la distribución de fuerzas en espacio y tiempo y por supuesto, la realización de operativos de seguridad e inclusive de campañas de información y prevención por medios masivos de comunicación. Como beneficio adicional para los funcionarios responsables de la seguridad pública, la capacidad de conocer ese comportamiento (denominado en términos técnicos: tendencia espacio-temporal) de la actividad delictiva proporcionaría un fundamento más adecuado para evaluar su desempeño en la toma de decisiones. La simple comparación entre las tendencias anticipadas, las medidas de prevención por ellos adoptadas y el resultado de las acciones emprendidas proporcionaría el mencionado fundamento. Todo lo anterior permitiría una mejor planeación del presupuesto que anualmente se destina a seguridad pública, así como una mejor distribución del mismo en los diferentes rubros que componen tan compleja actividad. 1.2 Planteamiento del Problema Con base en los antecedentes expuestos anteriormente, es necesario señalar la importancia de que todos funcionarios responsables de la seguridad pública, cuenten con instrumentos de Análisis Delictivo, que les permita determinar las tendencias espacio-temporales que presentan las familias delictivas dentro de la zona de su responsabilidad, a fin de realizar una planeación que tenga como base la prevención en vez de la reacción. El hecho de poder anticipar la tendencia de cada familia delictiva dentro de una zona y en un tiempo determinado, no es el único problema al que se enfrentan los mandos policiacos a la hora de concebir estos planes, la falta de recursos humanos, económicos y materiales es un escenario común en los países en vías de desarrollo como México. Esta falta de recursos hace necesario implantar un mecanismo que permita asignar prioridades de atención entre diferentes familias delictivas, con el objetivo de hacer un uso eficiente de los recursos para 3 Capítulo Uno Introducción atender primeramente a aquellas que tienen un mayor impacto en la población, para posteriormente atender aquellas que presentan un impacto menor y con ello ir reduciendo de manera gradual el índice delictivo de una región de estudio. El hecho de que se asignen prioridades de atención a las familias delictivas no debe significar el total desentendimiento de fuerzas de orden público para aquellas familias que no presentan un problema mayor. Es necesario dividir las fuerzas del orden público en dos grupos: el primero encargado de establecer una vigilancia continua y, el segundo, encargado de atender aquellas actividades delictivas que, de acuerdo con el análisis realizado, requieran de atención inmediata. 1.3 Objetivos 1.3.1 Objetivo General Desarrollar una metodología para el Análisis y Predicción Delictiva que permita determinar: • Las familias delictivas que presentan actividad notable dentro de un espacio-tiempo de referencia. Se entenderá por espacio-tiempo en este trabajo a una región de estudio a la que se le realiza Análisis y Predicción Delictiva en un periodo de tiempo específico (Año, Mes, Semana, etc.) • Los periodos del año y horarios en que estas actividades presentan mayor actividad. • Los espacio-tiempos en los cuales es posible disminuir la asignación de recursos humanos y materiales para atender a las familias delictivas notables de otros espacio-tiempos. • Los espacio-tiempos en donde la mayoría de las familias delictivas se presentan. • Finalmente, la cantidad de delitos que, según la predicción basada en el historial delictivo, ocurrirán en un espacio-tiempo determinado. 1.3.2 Objetivos Específicos • Desarrollar una metodología para el Análisis Delictivo que estudie el comportamiento espacio-temporal de las familias delictivas y sus patrones dentro de una región de estudio propuesta. 4 Capítulo Uno Introducción • Desarrollar una metodología para Predicción Delictiva que, a partir de la información obtenida de una región de estudio propuesta, anticipen por cada una de las familias delictivas, el número de hechos delictivos que se espera ocurran en una zona y tiempo determinado. • Con base en los resultados obtenidos de los dos análisis anteriores, generar recomendaciones que permitan a las fuerzas del orden público mejorar sustancialmente la asignación de recursos necesarios, tanto materiales como humanos, para hacer frente a las familias delictivas que afectan un área de manera característica y con problemas de incrementos delictivos identificados. • Implementar un sistema de información que incorpore la metodología para el Análisis y Predicción Delictiva y que trabaje dentro de una arquitectura de red cliente-servidor, a fin de ser utilizada por los responsables de la de seguridad pública en diferentes planes preventivos, desde varias locaciones y en cualquier momento. 1.4 Contribuciones Dentro de los resultados que se obtuvieron del desarrollo de este trabajo de tesis se tienen las siguientes contribuciones:  Se desarrolló una nueva metodología para Análisis Delictivo basada en la caracterización espacio-temporal de patrones delictivos.  Se desarrolló una metodología de Predicción Delictiva basada en el análisis del comportamiento de una actividad delictiva durante sus últimos 12 meses y su comportamiento a través de los años en la muestra disponible, que permite calcular la cantidad de hechos delictivos se espera ocurran en un espacio-tiempo con un error mínimo.  Se desarrolló un sistema de información que permite incorporar las dos contribuciones anteriormente planteadas dentro de una arquitectura cliente-servidor, con el objetivo de que dicho sistema esté disponible para todos los elementos involucrados en el proceso de planeación y aplicación de la actividades tendientes a reducir los índices delictivos, desde cualquier locación y en cualquier momento.  Finalmente, en el capítulo de conclusiones, existe un apartado (7.2) en donde se explica de manera detallada las aportaciones técnicas que el presente trabajo 5 Capítulo Uno Introducción desarrolló sobre diferentes algoritmos de clasificación supervisada, empleados en el enfoque Lógico-Combinatorio en Reconocimiento de Patrones. 1.5 Trabajos publicados 1. 2. Congresos Internacionales  “Automatic Spatio-Temporal Characterization of Criminal Activity. A New Algorithm and a Public Security Decision-Support System”, Research in Computing Science, Advances in Computer Science and Engineering, vol. 42, Mayo 2009.  “The Kora-Ω Algorith for Spatio-Temporal of Criminal Activity”, 4to. Congreso Internacional “Tendencias Tecnológicas en Computación 2008”, CIDETEC, 2008. Revista Internacional Arbitrada “The CR-Ω+ Classification Algorithm for Spatio-Temporal Prediction of Criminal Activity”, Journal of Applied Research and Technology, vol. 7, 3 de diciembre 2009. 3. Publicaciones en Proceso. Al momento de imprimir este trabajo se encuentra en elaboración dos artículos, el primero de ellos, relacionado con la metodología de Predicción Delictiva propuesta y su aplicación en el área de Análisis Delictivo; el segundo enfocado a presentar las modificaciones realizadas a los algoritmos de clasificación KORA-Ω y CR+. 1.6 Organización de la Tesis Con base en los objetivos expresados, esta TESIS se estructura de la manera siguiente: En el capítulo de introducción se describe la problemática que el presente trabajo de tesis aborda dentro del contexto de seguridad pública. En el capítulo 2 se presenta el estado del arte sobre criminología y criminalística, así como, lo relativo a los diferentes tipos de Análisis Delictivos que se desarrollan tanto en México como en diferentes partes del mundo. 6 Capítulo Uno Introducción En el capítulo 3 se presentan los fundamentos teóricos (conceptos y definiciones) que se emplearon durante el desarrollo de la metodología para el Análisis y Predicción Delictiva propuestos. En el capítulo 4 se describe de manera detallada la metodología desarrollada para el Análisis y Predicción Delictiva, así como su interpretación semántica. En el capítulo 5 se exponen los resultados obtenidos de la aplicación de las metodologías propuestas para Análisis y Predicción Delictiva sobre una base datos de hechos delictivos de la ciudad de Sacramento, en el estado de California, E.U.A. En el capítulo 6 se describe el diseño de un sistema de información que incorpora las metodologías propuesta dentro de una arquitectura de red cliente-servidor, así como los requerimientos mínimos necesarios para su implementación. Las conclusiones derivadas de los resultados obtenidos de la experimentación realizada anteriormente se presentan en el capítulo 7. Por último, en la parte final, se presenta:  La bibliografía consultada durante la realización de esta tesis. 7 CAPÍTULO DOS Estado del Arte Se presenta el estado del arte sobre Criminología, Criminalística y lo relativo a los diferentes tipos de Análisis Delictivos que se desarrollan tanto en México como en diferentes partes del mundo. 8 Capítulo Dos Estado del Arte L a realidad actual exige un cambio en la forma de percibir, analizar y juzgar los programas y operaciones de prevención y combate a la delincuencia. La situación económica mundial evidencia la necesidad de detener, o incluso revertir, el constante incremento en los presupuestos destinados a la seguridad pública. Cada vez resulta más complicado justificar la asignación de fondos para corporaciones policiacas que, en términos generales, ofrecen pobres resultados y un mínimo impacto de su actividad cotidiana en la calidad de vida de los ciudadanos. Al mismo tiempo, también resulta claro que el papel de las organizaciones y cuerpos policiacos es decisivo en la prevención del delito. Por ello, en los últimos años se han puesto de manifiesto fuertes preocupaciones sociales por la eficacia y eficiencia de las policías, tanto a nivel de la integridad y capacitación de los agentes que las componen, como a nivel de las políticas y estrategias de las organizaciones mismas. “…Estas fuerzas brindan un nuevo ímpetu para examinar medidas de largo plazo y necesidades descuidadas, tales como generar en la policía la capacidad institucional de evaluar el producto de su trabajo, de analizar constantemente su marcha antes de hacer más de lo mismo, determinar lo que se espera cumpla la policía y encontrar la manera más fácil de lograrlo” [Arango, 2006]. En términos generales, esta preocupación por la eficacia y eficiencia de la policía, aunque presenta sólidos argumentos, dispone también de suficientes y variados elementos para proponer soluciones. Colectivamente se conoce mucho sobre el amplio rango de problemas de comportamiento que constituyen el trabajo de la policía, así como las mejores formas de prevenirlos [Gottlieb-Arenberg-Singh, 1994]. Es posible, hoy en día, encontrar gran cantidad de información sobre prácticas exitosas de las agencias de seguridad y sobre propuestas específicas de agentes experimentados en el tema. Dicha información puede encontrarse en la literatura básica sobre delincuencia y prevención del crimen, especialmente en los textos sobre prevención situacional del delito. Para que la disponibilidad de toda esa información realmente redunde en mejoras palpables y de fuerte impacto, tanto social como económico, esa información debe ser rigurosamente analizada para determinar qué actividades resultan óptimas según la problemática específica a enfrentar en cada demarcación [Arango-Lara, 2008(2)]. No existe actualmente un consenso, nacional o internacional, sobre el concepto de Prevención Delictiva. Son múltiples las definiciones existentes y cada una de ellas enfatiza aspectos diferentes. Como ejemplo de esto basta con mencionar dos de las consideradas más representativas. En primer lugar, el investigador catalán Soria Verde, en su tratado sobre Victimología, define la Prevención Delictiva como: 9 Capítulo Dos Estado del Arte “...la acción social dirigida a la mejora de la calidad de vida, mediante acciones tendientes a que un determinado problema no aparezca o atenúe sus efectos...” [Verde, 1993]. Por su parte, Rodríguez Manzanera, en su obra Criminología, expresa un sentido más específico del término: “...en materia Criminológica, prevenir es conocer con anticipación la probabilidad de una conducta criminal, disponiendo los medios para evitarla...” [Manzanera, 1993]. 2.1 Criminalística y Criminología El enorme progreso tecnológico experimentado por nuestro siglo ha acarreado, por una parte, el nacimiento de nuevas ciencias y, por otra parte, el desarrollo de ciencias cuyos orígenes no se remontan más allá del siglo pasado. En este último caso se encuentran la Criminalística y la Criminología que sirven de auxiliares de la justicia para la determinación de las posibles causales de los delitos ocurridos. 2.1.1 Criminalística La criminalística es una disciplina que aplica fundamentalmente los conocimientos, métodos y técnicas de investigación, de las ciencias naturales, en el examen de material sensible, significativo y relacionado con un presunto hecho delictivo, con el fin de determinar, en auxilio de los órganos de administrar justicia, su existencia, reconstruirlo o bien señalar y precisar la intervención de uno o varios sujetos en el mismo [Montiel, 1997] Una definición más formal de la criminalística es la siguiente: "La Criminalística es una ciencia penal auxiliar, que mediante la aplicación de sus conocimientos, metodología y tecnología descubre y verifica científicamente la existencia de un hecho presuntamente delictuoso y al o los responsables aportando las pruebas a los órganos que procuran y administran justicia" [Montiel, 1997]. 2.1.2 Criminología Esta ciencia social estudia la naturaleza, extensión y causas del delito; características de los delincuentes y de las organizaciones delictivas; problemas de detención y castigo de los 10 Capítulo Dos Estado del Arte delincuentes; operatividad de las prisiones y de otras instituciones carcelarias; rehabilitación de los convictos, tanto dentro como fuera de prisión, y la prevención del delito. La ciencia de la Criminología tiene dos objetivos básicos: la determinación de causas, tanto personales como sociales, del comportamiento delictivo y el desarrollo de principios válidos para el control social del delito. Para la consecución de estos objetivos, la Criminología investiga a partir de los descubrimientos de otras disciplinas interrelacionadas con ella, tales como la Biología, Psicología, Psiquiatría, Sociología, y Antropología [1]. El presente trabajo de tesis, aunque evidentemente se trata de una investigación dentro del marco de las ciencias de la computación y, en particular, en el área de Inteligencia Artificial y Reconocimiento de Patrones, puede también ser ubicado dentro de esta ciencia auxiliar de la justicia, ya que determina el comportamiento de la actividad delictiva que se presenta dentro de un área de estudio. 2.2 Análisis Delictivo En la actualidad, no existe una definición universalmente aceptada de lo que es Análisis Delictivo. En algunos departamentos de policía es considerado como el estudio de reportes policiacos y la extracción de información que permita la captura de delincuentes, en particular, asesinos seriales [Osborne-Wernicke, 2006]. En otras agencias, el análisis delictivo consiste en extraer datos estadísticos de las bases de hechos delictivos que ocurren dentro un área y dividirlos en familias delictivas y épocas del año [Osborne-Wernicke, 2006]. Sea cual sea la definición de Análisis Delictivo, éste tiene por objetivo, encontrar información importante dentro de los datos contenidos en cada uno de los hechos delictivos y diseminarla entre los oficiales e investigadores para ayudarlos en la captura de posibles delincuentes, así como frenar la actividad delictiva [Osborne-Wernicke, 2006]. La definición formal de Análisis Delictivo empleada en esta tesis es la siguiente: “Análisis Delictivo es como el conjunto de procesos y técnicas de análisis dirigidos a proveer información oportuna y pertinente relativa a hechos y correlaciones de tendencia delictiva a el personal operativo y administrativo durante la planeación de acciones tendientes a prevenir y evitar actividades delictivas, ayudar en los procesos de investigación, incrementar la aprensiones de delincuentes, asignación de recursos y esclarecer los casos“[Osborne-Wernicke, 2006]. 11 Capítulo Dos Estado del Arte Cualquier estudio u observación por sencillo que sea, que se lleve a cabo sobre la actividad delictiva ocurrida dentro de una región de estudio y un periodo de tiempo puede ser considerado como Análisis Delictivo. Esto le permite a cualquier departamento de policía alrededor del mundo, proponer la forma en que realiza este análisis, lo que ha permitido que éstos incursionen en diferentes campos y ciencias auxiliares de esta disciplina, a fin de dar respuesta a las necesidades de información de los cuerpos de policía operativos que se encargan del trabajo de campo. Por otra parte esa sencillez del concepto, ha provocado que en la actualidad el simple hecho de determinar el incremento o decremento de una cierta actividad delictiva dentro de una región de estudio y plasmar esta información dentro de un informe sea considerado como Análisis Delictivo en ciertos departamentos de policía. 2.2.1 Tipos de Análisis Delictivo A pesar de no existir una definición unificada de Análisis Delictivo en posible agrupar los diferentes tipos de análisis que se desarrollan en los departamentos de policía de la siguiente manera [Osborne-Wernicke, 2006]: 1. Análisis Delictivo Táctico Se basa en determinar dónde, cuándo y cómo se están cometiendo los delitos para que a los oficiales de policía e investigadores. Sin embargo, otro rol de este tipo de análisis es el de encontrar patrones comunes a cierto tipo de delito, que prediga nuevos hechos delictivos dentro de la misma área y modo de actuar de los delincuentes. 2. Análisis Delictivo Estratégico Desarrollado por los mandos superiores encargados de la de seguridad pública para resolver problemas delictivos de gran impacto y planear proyectos a largo plazo. El resultado obtenido de este análisis es proporcionado como información a niveles menores para que estos a su vez lo consideren dentro de la planeación de sus respectivos sectores. 3. Análisis Delictivo Administrativo Se centra en proveer a los diferentes organismos policiacos datos, estadísticas e información referente a la tendencia delictiva presentada dentro de una zona. 12 Capítulo Dos Estado del Arte 4. Análisis Delictivo de Investigación Se encarga del estudio de la conducta criminal para la creación de perfiles policiacos (socio-económicos, culturales y psicológicos), de sospechosos, delincuentes y víctimas, a efecto de detectar posibles delincuentes, asesinos en serie y fundamentar los estudios de victimología. 5. Análisis Delictivo de Inteligencia Se desarrolla en los niveles federales y estatales, centrándose principalmente en el estudio del crimen organizado, terrorismo, etc. 6. Análisis Delictivo de Operaciones Tiene como objetivo evaluar el aprovechamiento de los recursos dentro de una organización policiaca (presupuestos, recursos humanos, inventarios de armas, estados de fuerza, aprovechamiento tecnológico, etc.). 2.2.2 Análisis Delictivo en México En la actualidad, las organizaciones policiacas en México presenta muchas deficiencias en la metodología para la realización de Análisis Delictivo, tradicionalmente el trabajo en este campo es realizado por oficinas denominadas de “Análisis Delictivo”, las cuales generalmente no cuentan con personal capacitando en y únicamente se limitan al conteo y clasificación de los delitos que ocurren en su región de responsabilidad para posteriormente ser mostrados mediantes graficas en informes que son enviados a sus jefes inmediatos o distribuidos a las áreas operativas en forma de información que en teoría debería de ayuda a estos en la prevención del delito. Independientemente del tipo de enfoque que se emplee para la realización del Análisis Delictivo, es vital contar con información verídica, completa y oportuna de los hechos delictivos ocurridos dentro de una región de estudio. Sin embargo, el proceso de generación de datos es el proceso más complicado de realizar. El Instituto Ciudadano de Estudios sobre Inseguridad (I.C.E.S.I.) publicó en junio del 2008 un artículo titulado “Generación de Información en Seguridad Pública” donde plantea, de manera clara, los principales problemas que actualmente tiene México para recolectar información adecuada para la realización de Análisis Delictivo. A continuación se describen estos problemas [I.C.E.S.I., 2008]: 13 Capítulo Dos Estado del Arte 1. Maquillaje de origen Actualmente los sistemas de información, al menos los conocidos, captan únicamente lo relacionado a la averiguación previa (AP) y la hacen equivalente a un delito. Es decir que aunque en un solo incidente concurran dos o más delitos (por ejemplo en un robo puede haber alguna lesión o agresión física de la víctima) en la AP que inicia el agente del ministerio público (MP) registra estadísticamente un solo delito, por lo general el que considera más grave. Existen otros casos en ciertas entidades federativas en donde hay registro de un mayor número de AP que delitos ocurridos, lo cual es imposible. 2. Problemas relacionados con la información Cantidad de la información: No existe una norma que señale a las entidades cuánta y qué tipo de información de debe generarse de cada uno de los delitos denunciados. Tipo de la información: Aunque existe el formato CIEISP (cuyas siglas significan Comité Interinstitucional de Estadística e Información en Seguridad Pública), que podría servir como base para la generación de información estadística, las entidades terminan por reportar con diferentes niveles de agregación y de conceptos, que incluso internamente cambian de un año a otro. Hay casos en los que ni en una misma entidad es posible hacer comparaciones, por estas diferencias de información. Homogenización: El problema anterior está ligado con el de la estandarización de la información. Algunas entidades o dependencias reportan por mes, otros por trimestre, otros por año, algunas por día, aunque de un momento a otro cambian conceptos y agregan o desagregan información sin que medie alguna guía o documento que permita entender los motivos, y menos aún que información estaba contemplada en el rubro anterior y donde se contempla bajo los nuevos esquemas de clasificación. Falta de confiabilidad: En muchas ocasiones la información se maneja para alcanzar ciertos propósitos. Así por ejemplo si es para dar a conocer a la población los resultados en materia de seguridad o para presentar en informes de gobierno se reportan datos a la baja; si es para contar con más recursos por parte del Sistema Nacional de Seguridad Pública los datos son más altos. Es así que muchas entidades cuentan con dos o más sistemas de información, que se mueven de manera distinta, de acuerdo con los objetivos que persigan. Disponibilidad: En el mejor de los casos la información se hace pública hasta con dos años de retraso y, en el peor, la información nunca llega a hacerse pública. Por ejemplo, un caso típico donde no se cuenta con mayor información (y que debería ser objeto de rendición de 14 Capítulo Dos Estado del Arte cuentas), corresponde a aquel en donde las AP se "resuelven" por prescripción, es decir extinción de la acción penal por el paso del tiempo que hace que por ley las AP pasen al archivo de asuntos concluidos sin que se haya resuelto nada al respecto. A veces este tipo de "asuntos concluidos" llegan a representar un porcentaje mayor al 50% del total. Asimismo, otro de los puntos que tiene que ver con la disponibilidad se refiere a que en muchas ocasiones la información se mantiene sin darse a conocer en períodos muy largos y que para efectos de análisis deja de ser útil. Para que la información pueda tener un uso eficiente especialmente para delinear políticas de prevención debiera estar disponible máximo con un mes de atraso. Temporalidad. A nivel nacional, con la información por entidad federativa, no se sabe nada del día y la hora en que se cometen los delitos, si estos son mayores en quincenas o días de pago, los fines de semana, si ocurren por la mañana o por la tarde, si se dan en días de fiesta patronales, etc. Lo anterior resulta relevante ya que, de acuerdo con la temporalidad, se pueden definir políticas diferentes de atención incluso sobre un mismo delito. 3. Contextualización de los delitos No es posible elaborar políticas de prevención si los delitos no se contextualizan. Por ejemplo, en el caso de un homicidio interesa, entre otras cosas, conocer el contexto, es decir, si había o no relación previa entre víctima y victimario, si el homicidio ocurrió en el interior de una vivienda o negocio, si se dio en la calle, si se utilizó o no un arma y qué tipo de arma, si se dio bajo el influjo del alcohol o alguna otra droga, si participaron una o varias personas, si fue en riña. De cada una de estas preguntas se desprenden medidas de intervención diferentes. Por ejemplo, es sabido que no se pueden hacer políticas de prevención del homicidio cuando existe relación previa entre víctima y victimario. Es decir, cuando una persona quiere matar a otra por cuestiones afectivas no hay poder que lo impida. Así puede señalarse el caso donde dos conocidos compadres, uno del otro, empiezan tomando en una reunión de amigos, continúan tomando en la casa de uno de ellos y, de repente, uno de ellos ve o cree ver que las miradas que está realizando el compadre sobre la comadre no son las adecuadas, vienen los reclamos, éstos suben de tono y uno de ellos acaba matando al otro. Ante esta situación no hay nada que hacer. 15 Capítulo Dos Estado del Arte Lo mismo sucede con los homicidios por ajustes de cuentas entre delincuentes participantes en crimen organizado. No existe poder humano, ni política de seguridad pública, que vaya a impedir este hecho. Otro delito es el de la violación, donde la contextualización es importante. No sirve de nada tener a 50 policías fuera de la casa de un padre violador, ya que la violación se va a dar en el interior del hogar. 4. Análisis longitudinal En este momento no existe posibilidad de realizar un análisis, a lo largo del tiempo, de lo que sucede con cada asunto que lleva el aparato de seguridad pública en su conjunto (prevención, procuración y administración de justicia, rehabilitación social), debido a que en cada etapa del proceso se asignan números distintos o a que cada parte del proceso se considera como independiente una de la otra. Así no se sabe para un evento en particular, si hubo o no intervención policíaca, por qué delitos se inicia una averiguación previa, cuántos y cuáles fueron los delitos por los que se inició, cuántos, cuáles, en su caso, y de qué sexo eran los delincuentes, cuántos, cuáles y de qué sexo eran las víctimas, por qué delitos se consigna una averiguación previa, por qué delitos se procesa, por qué delitos se sentencia, por qué delitos están los delincuentes presuntos o sentenciados en prisión, etc. 5. Información faltante La mayoría de los eventos en que intervienen las fuerzas policiales quedan en el olvido, lo que impide evaluar dónde son eficientes, dónde no lo son y dónde se necesitan pequeños actos de administración para lograr esa eficiencia. No se conoce el personal policiaco de los tres niveles de gobierno: cuántos son, dónde están, cómo se distribuyen, cuántos y cuáles están capacitados, qué turnos tienen, las edades, sexos, etc. Falta información sobre el equipamiento: en qué estado se encuentra, cuánto es, cuántas armas existen, etc. La información de los penales es completamente deficiente, no se conocen flujos de entrada- salida, por delito, tiempo en prisión, sexo, ocupación, reincidencia, etc. 16 Capítulo Dos Estado del Arte 6. Georeferencia No es posible ubicar cada hecho delictivo mediante coordenadas geográficas. Asimismo, no se describen las características del espacio donde se cometió el crimen (iluminación, abundancia de árboles, cuadrantes de calles, etc.). 7. Información de los victimarios Aunque parezca increíble, de los delincuentes se tiene poca información: no se conoce cuántos son, el sexo, su edad, su apariencia, si actúan o no en grupo, las horas y días preferidos para cometer delitos, las armas que utilizan, el tipo de víctimas que escogen, los lugares donde atacan principalmente, el modus operandi, etc. 8. Información de la víctima Por supuesto que, si la información anterior presenta deficiencias importantes, en la estadística oficial la víctima no existe en lo absoluto. Así, con esa información, es imposible conocer cuántos hombres y cuántas mujeres son víctimas del delito, los lugares donde han sido victimizados, los horarios más frecuentes, el delito o delitos que padecen, las edades que tienen, etc. En conclusión, podemos determinar que mientras en México no exista un sistema unificado de información delictiva que contemple a los tres niveles de Gobierno (Federal, Estatal y Municipal) y no se establezca un canal de comunicación entre los organismos encargados de la seguridad pública y el sector educativo, principalmente con universidades, quienes podrían aportar las herramientas científicas y tecnológicas, será casi imposible realizar un Análisis Delictivo que realmente permita hacer frente a los problemas de inseguridad que actualmente se viven en el país, limitándose como hasta el momento a atacar los delitos una vez que estoy ya ocurrieron. 2.2.3 Sistemas de Análisis Delictivo en el Mundo Los principales sistema de Análisis Delictivo que se pueden encontrar en la actualidad han sido desarrollados por empresas privadas o los departamentos de policía de diferentes estados en países como: Estados Unidos de América, Inglaterra, España, etc. A continuación se describen algunos de ellos. 17 Capítulo Dos Estado del Arte 2.2.3.1 STAC (Spatial and Temporal Analysis of Crime, 1988) STAC es un paquete de software que se compone de dos programas: un analizador temporal y un analizador espacial. El paquete de STAC se completó en 1988, con el apoyo del Departamento de Justicia de E.U.A., Oficina de Estadísticas de Justicia. Este paquete fue creado en respuesta a las solicitudes de los organismos policiales locales para mejorar sus capacidades de Análisis Delictivo. Su objetivo principal es localizar agrupaciones de actividad delictiva dentro de una comunidad mediante la automatización de funciones como el análisis de tiempo en los datos de los delitos cometidos y la colocación manual de puntos de interés en mapas (Map Pin). El analizador temporal ayuda a determinar el momento más probable del día y el día de la semana que un determinado tipo de delito se produce, incluso cuando la información de que dispone la policía es imprecisa. El analizador espacial ayuda a encontrar las áreas en una comunidad donde hay focos rojos delictivos (hot Spots). Este analizador no es un paquete de mapas, sino que ayuda a los analistas que ya tienen la capacidad de mapeo en la representación de resultados. STAC primero encuentra las agrupaciones más densas de puntos en el mapa, y luego ajusta una "elipse de desviación estándar" a cada una de estas agrupaciones. El analista puede entonces hacer comparaciones entre diferentes agrupaciones. Esta aplicación y su información técnica esta está disponible de manera gratuita en: http://www.icjia.state.il.us/public/index.cfm?metaSection=Data&metaPage=STACfacts La figura 1 muestra la forma en que este sistema muestra algunos de los resultados obtenidos de su análisis. 18 Capítulo Dos Estado del Arte Figura 1. Sistema STAC 2.2.3.2 CrimeLink (PCI Precision Computing Intelligence 1993) CrimeLink es una herramienta visual de Análisis Delictivo diseñado para ayudar a los analistas e investigadores en la conversión de grandes cantidades de datos aparentemente independientes y sin relación en productos gráficos de análisis ordenados, comprensibles y comprensibles. Automatizando las probadas técnicas de análisis como: Matrices de Asociación, Gráficas de evento-hora, rueda de análisis de patrones y Análisis de llamadas. CrimeLink es la solución perfecta para comprender y resolver problemas complejos que involucran lucha contra el terrorismo, la delincuencia organizada, operaciones militares, las drogas, el fraude financiero, investigaciones importantes, al por menor, y cualquier otro conjunto de actividades complejas, de conspiración o de redes sociales. La matriz de asociación visualiza en una sola matriz, las personas y las entidades involucradas en los hechos delictivos, lo que permite encontrar posibles relaciones entre todas ellas. Cada celda de la matriz se asemeja a la tabla de distancias en un atlas de carreteras y representa una posible relación. La matriz de asociación es un registro de quién conoce a quién, quién ha hecho cada quien y quien ha estado donde. La figura 2 muestra esta matriz. 19 Capítulo Dos Estado del Arte Figura 2. Matriz de asociación de CrimeLink El Gráfico Eventos-Hora (GEH) y la Rueda de análisis de patrones son un grupo de registros cronológicos diseñados para almacenar y mostrar grandes cantidades de información en el menor espacio posible. Cada registro cronológico es único para cada grupo de estudio y muestra las actividades delictivas relacionadas con el grupo en una variedad de formatos y pantallas. El GEH es fácil de preparar, entender y utilizar. Al registrar la cronología, es posible analizar las actividades del grupo, las transiciones, las tendencias, y, en particular, los patrones de funcionamiento, es decir, los patrones en el tiempo y actividad. Si se desea, el evento puede ser un código de color para indicar un evento en particular o tipo de evento que ayude en el reconocimiento de patrones. El GEH es una herramienta de análisis de patrones que permite predecir los acontecimientos futuros de cierta actividad delictiva. La figura 3 muestra la interfaz de usuario del GEH. El análisis de llamadas está basado en información disponible de una variedad de fuentes que muestran el tipo y ubicación de los teléfonos o las comunicaciones relacionadas con el universo de estudio; el momento, la dirección y duración de las llamadas, los patrones de tiempo, orden de frecuencia de llamadas, facturación, y lo más importante, muestra toda una red de telecomunicaciones, así como la identificaciones individuales y corporativas. La figura 4 muestra la interfaz de usuario del analizador de llamadas. CrimeLink y su información técnica está disponible en: http://www.pciusa.us/. 20 Capítulo Dos Estado del Arte Figura 3. Rueda de análisis de patrones Figura 4. Análisis de llamadas de CrimeLink 2.2.3.3 CrimeView (Omega Group 1992) CrimeView el software de Análisis Delictivo y mapeo más utilizado en América del Norte. Cientos de agencias utilizar este software para las investigaciones, el despliegue de recursos y la gestión de emergencias. Permite a los usuarios finales importar automáticamente datos delictivos hacia una plataforma de mapas que visualiza geográficamente la actividad delictiva. CrimeView ofrece a los analistas delictivos una interfaz sencilla para encontrar focos rojos delictivos (hot spots) y reporte de llamadas. Con funciones automatizadas, como umbrales de alertas y la generación de informes. 21 Capítulo Dos Estado del Arte Características Principales de CrimeView 1. Filtra: Permite la búsqueda de hechos delictivos por categorías (tipo de delito, fecha y hora). 2. Fijar: Encuentra áreas con problemas graves de delincuencia (hot spots) y crea mapas de llamadas que ayudan a aislar las áreas problemáticas. La figura 5 muestra la forma en que son presentados los focos rojos delictivos (hot spots) encontrados. 3. Automatiza: Las tareas repetitivas como la generación de informes periódicos. 4. Alerta: hace notificaciones cuando la delincuencia supera un nivel específico. 5. Informa: Realiza reportes detallados y resumidos de cualquier capa de la delincuencia y las clasifica por numerosas categorías. 6. Gráfica: Crea tablas y gráficos por día de la semana, hora del día y mes del año. Esta herramienta y su información técnica se encuentra http://www.theomegagroup.com/police/crime_mapping_solutions.html. disponible en: Figura 5. Sistema CrimeView 2.2.3.4 ArcGis (Extensión para Análisis Delictivo 2000) En la actualidad, los departamentos de policía están utilizando análisis de datos espaciales para evaluar patrones delictivos, optimizar la asignación de recursos, y mejorar la respuesta 22 Capítulo Dos Estado del Arte de llamada de emergencia. ArcGis es un sistema de información geográfica que actualmente cuenta con un módulo para Análisis Delictivo que emplea herramientas estadísticas diseñadas específicamente para su uso con los datos espaciales. Las herramientas con las que cuenta este software son: 1. Análisis de focos rojos delictivos (hot spots) en ArcGIS 9. Permite encontrar aquellas áreas con una densidad delictiva alta. La figura 6 muestra la forma en que ArcGis presenta los resultados obtenidos de este análisis. 2. Cálculo del centro principal. Permite calcular el centro principal de una actividad delictiva mediante el promedio de las coordenadas en x y y de cada una de los hechos delictivos ocurridos en una región de estudio. Figura 6. Análisis de focos rojos delictivos (hot spots) de ArcGis 3. Calculo de la dirección del delito. Determina la posible dirección que seguirá una familia delictiva. La manera más común para determinar la tendencia de puntos o áreas es calculando la desviación estándar de sus direcciones en x y y. Estas dos medidas definen los ejes de una elipse que muestra si la distribución de puntos se alarga, lo que indica que tiene una orientación particular. La figura 7 muestra la forma en que ArcGis presenta los resultados obtenidos de este análisis. 23 Capítulo Dos Estado del Arte Figura 7. Cálculo de la dirección del delito 2.2.3.5 A.T.A.C (Automated tactical analysis of Crime 2004) Es un paquete de estadísticas espaciales que puede analizar datos sobre la ubicación de la incidencia delictiva. Su objetivo es ofrecer una variedad de herramientas para el análisis espacial de la delincuencia. Está diseñado para operar grandes conjuntos de datos provenientes de hechos delictivos. Sin embargo, puede ser utilizado para otros tipos de aplicaciones que impliquen localización de puntos, como la ubicación de las detenciones, accidentes de vehículos, servicios médicos de urgencia, o instalaciones (por ejemplo, estaciones de policía). La aplicación permite realizar investigación y Análisis Delictivo con un amplio rango de procedimientos espaciales estadísticos que pueden ser incorporados dentro de un sistema de Información Geográfica. Características Principales de A.T.A.C: 1. Identificación de patrones: este software identifica patrones delictivos mediante la ordenación de datos y su consulta. 2. Análisis de Series de Tiempo: Este módulo tiene incorporado la mayoría de los métodos de análisis de series de tiempo existentes, los cuales pueden ser aplicados a la totalidad o sólo una parte de los datos con los que se cuente. Cuando un módulo ha terminado su análisis, se puede elegir un rango de tiempo específico para presentar los resultados. El módulo grafica los resultados de las distribuciones temporales utilizando un área, una línea o un gráfico de barras. La figura 8 muestra la forma en que son presentados los resultados de este módulo. 24 Capítulo Dos Estado del Arte Figura 8. Análisis de series de tiempo en el sistema A.T.A.C. 3. Predicción Temporal: El Módulo de Análisis Temporal Dinámico proporciona los medios para analizar y descubrir cualquier patrón temporal de los datos. Este análisis permite encontrar lo siguiente:  Predicción del próximo evento usando más de una docena de técnicas probadas de predicción.  Encontrar las relaciones entre las dos variables para descubrir motivaciones ocultas y pronosticar el próximo evento basándose en estas relaciones 4. Integración de Google Earth: Los resultados del análisis espacial pueden ser exportados a un formato de archivo KML de Google Earth. La figura 9 muestra la forma en que presentan los resultados en esta aplicación. 5. Mapeo: A.T.A.C., brinda un medio fácil para visualizar datos que contengan coordenadas X y Y en forma tabular, además puede leer archivos Shape ESRI para una comparación rápida entre los datos tabulares y la información geográfica existente. Este módulo permite calcular lo siguiente: • Áreas de densidad delictiva importantes (hot spots). La figura 10 muestra la forma en que son presentados los resultados de este análisis. • Cálculo de Distancias Euclidianas y de Manhattan. 25 Capítulo Dos Estado del Arte • Usar la tabulación X/Y para visualizar inmediatamente las posiciones en Google Earth. Figura 9. Integración del sistema A.T.A.C. con Google Earth. 6. Análisis de densidad: La función de hot spots está optimizado para identificar grupos estadísticamente significativos en los datos, fácilmente determinar el tamaño de la célula y la distancia de búsqueda adecuada. Independientemente del nivel de zoom, ATAC configurará la distancia óptima de búsqueda basado en la perspectiva actual del mapa en donde se trabaje. La figura 11 muestra la forma en que son presentados los resultados de este análisis Figura 10. Análisis de hot spots de A.T.A.C. 26 Capítulo Dos Estado del Arte Figura 11. Análisis densidad de A.T.A.C. Esta herramienta y su información técnica se http://www.bairsoftware.com/atac/features/identify.html 2.3 encuentran disponibles en: Conclusión El Análisis Delictivo es una herramienta indispensable en todas las dependencias encargadas de la seguridad pública, tanto en México como en cualquier parte del mundo. Sin embargo, en la actualidad, países como el nuestro están apenas en la etapa de creación de una estructura organizacional y tecnológica capaz de registrar de manera eficiente cada uno de los hechos delictivos que se presente en el país. Sin esta estructura, es imposible aplicar cualquier modelo matemático que sirva para hacer Análisis Delictivo, limitándose únicamente a la creación de informes que no aportan ninguna utilidad a los cuerpos operativos de la policía. En otros países, esta estructura ya existe y actualmente ponen a prueba muchos modelos matemáticos que están auxiliando a los cuerpos policiacos de todos los niveles en la toma de decisiones de seguridad pública. 27 CAPÍTULO TRES Marco Teórico Se detallan los conceptos teóricos empleados durante el desarrollo del presente trabajo de tesis. 28 Capítulo Tres Marco Teórico 3.1 Soporte a la toma de decisiones En las últimas décadas se han desarrollado diferentes sistemas de información que auxilian a los usuarios en la toma de decisiones, estos sistemas han recibido el nombre general de Sistemas de Apoyo a las Decisiones (DSS por sus siglas en inglés Decision Support Systems). Existen diferentes definiciones acerca de lo que es un DSS, sin embargo, para efectos de esta tesis consideraremos la siguiente: “Un DSS es un sistema de información basado en un computador interactivo, flexible y adaptable, especialmente desarrollado para apoyar la solución de un problema de gestión no estructurado que mejorar la toma de decisiones. Utiliza datos, proporciona una interfaz amigable y permite la toma de decisiones en el propio análisis de la situación" [Turban, 1995] Es evidente que los DSS pertenecen a un entorno con fundamentos multidisciplinarios, incluyendo (pero no exclusivamente) la investigación en base de datos, inteligencia artificial, Interacción hombre-máquina, métodos de simulación, ingeniería de software y telecomunicaciones. Arquitectura de un Sistema de Apoyo a las Decisiones Para diferentes autores existe una gran cantidad de componentes que conforman un DSS. Sin embargo, la mayoría de ellos cuentan, cuando menos, con los siguientes componentes: [Haag- Cummings- Phillips, 2000] 1. Sistema de Gestión de Base de Datos.- Almacena información de diversos orígenes, puede proceder de los repositorios de datos de una organización tradicional, de fuentes externas (como Internet), o del personal (de ideas y experiencias de los usuarios individuales). 2. Sistema Gestor de Modelos.- Se ocupa de las representaciones de los acontecimientos, hechos o situaciones utilizando diversos lenguajes simbólicos. 3. Sistema Gestor y Generador de Diálogos.- Se trata de la interfaz de con el usuario; es por supuesto, el componente que permite a un usuario interactuar con el sistema. 29 Capítulo Tres Marco Teórico 3.2 Reconocimiento de Patrones Se entiende por Reconocimiento de Patrones, a la rama del conocimiento científico, de carácter multidisciplinario, cuyo objeto de estudio son los procesos de identificación, caracterización, clasificación y reconstrucción, sobre conjuntos de fenómenos o entes, tanto físicos como abstractos, así como el desarrollo de teorías, metodologías y tecnologías relacionadas a dichos procesos. En la definición anterior se entiende por identificación al proceso por el cual se llega al conocimiento o localización precisa de un resultado u objeto buscado en un conjunto. Por Caracterización se entiende la determinación de los atributos particulares de un objeto, de forma tal que sea posible distinguirle claramente de entre otros semejantes. Clasificación es el ordenamiento y disposición de los objetos en diferentes categorías o clases según criterios establecidos de semejanza. Por último, reconstrucción se entiende como el proceso de reunir o evocar las diferentes partes constitutivas de un objeto o fenómeno para completar el concepto o conocimiento del mismo. Tomando como punto de partida la definición propuesta, este trabajo se ubica como parte del desarrollo de metodologías y tecnologías relacionadas con los procesos propios del reconocimiento de patrones. 3.2.1 Enfoques en reconocimiento de Patrones En la actualidad, no existe hoy en día una teoría unificada en reconocimiento de patrones (RP) [Duda-Hart, 73], menos aún una visión uniforme sobre los supuestos fundamentales, las metodologías o las herramientas que han de ser usadas pata tal actividad. Por ello, en el trascurso de la corta historia de la disciplina, han surgido diferentes enfoques para abordar el reconocimiento de patrones. Los enfoques más comúnmente estudiados y con mayor impacto en términos de sus resultados son el enfoque Estadístico, el Neuro-reticular, el Sintáctico-estructural, y el Lógico-Combinatorio. Se presenta, a continuación, una breve caracterización de cada uno de ellos en términos de sus fundamentos teóricos y herramientas distintivas. 1. Enfoque Estadístico Su fundamento es la Teoría de probabilidad y la Teoría bayesiana de la decisión. Los procedimientos que comúnmente usa son los de la Estadística inferencial y descriptiva, en especial el análisis discriminante. Opera bajo el supuesto fundamental de que los patrones son un conjunto de medidas numéricas, definidas sobre un espacio métrico o normado y con distribuciones de probabilidad conocidas [Fukugama, 72], [Devroye-Lugosi, 96]. 30 Capítulo Tres Marco Teórico 2. Enfoque Neuro-Reticular Se fundamenta en la Teoría conexionista surgida en el ámbito de la neuropsicología. Para clasificar patrones utiliza una estructura de neuronas artificiales interconectadas que se estimulan unas a otras, llamadas Red Neuronal y en la que cada neurona puede ser “entrenada” para entregar una respuesta específica ante ciertos estímulos predeterminados [Marques de Sá, 01], [Haykin, 99]. 3. Sintáctico-Estructural Se basa en encontrar las relaciones estructurales que guardan entre sí los patrones en estudio, utilizando la teoría de lenguajes formales y funciones recursivas para construir gramáticas que describan la estructura del universo de patrones. Emplea la Teoría de autómatas para construir algoritmos que puedan reconocer los patrones [Fu, 82], [González-Thomason, 78]. 4. Enfoque Lógico-Combinatorio El objetivo de este enfoque es modelar situaciones sin los supuestos restrictivos de otros enfoques, es decir, en donde los patrones puedan estar formados por cualquier combinación de características tanto cualitativas como cuantitativas. Los problemas de clasificación se modelan según la Teoría clásica de conjuntos o la Teoría de subconjuntos difusos. Típicamente se aplica la Teoría de Testores para determinar las características esenciales de cada patrón. Es común, en este enfoque, estudiar y modificar algoritmos generados originalmente en otros enfoques para remover algunas de sus limitaciones y extender su capacidad de aplicación. [Martínez-Trinidad-Guzmán-Arenas, 01], [ShulcloperGuzmán Arenas-Martínez Trinidad, 99], [Shulcloper-Lazo, 90], [Shulcloper-Abidi, 02]. Resulta importante ubicar el presente trabajo en el contexto de un enfoque específico, el lógico-combinatorio, para permitir la comprensión cabal de los problemas abordados, las soluciones propuestas y el impacto de las mismas en la actividad cotidiana de investigadores, docentes y estudiantes de RP. Todos los planteamientos, propuestas y soluciones contenidas en este trabajo deben de entenderse primordialmente desde la perspectiva de este enfoque. 3.2.2 Enfoque Lógico Combinatorio Los principios que fundamentan el enfoque lógico-combinatorio surgen a mediados de la década de 1960, en la ex Unión de Repúblicas Socialistas Soviéticas (URSS), a partir de los 31 Capítulo Tres Marco Teórico trabajos de [Dimitriev-Zhuravlev-Kendrelev, 66] sobre la formalización matemática de los problemas de clasificación. Estos trabajos retoman las investigaciones sobre Teoría de testores publicados casi una década antes en [Chenguis-Yabloskii, 55] y [ChenguisYabloskii, 58] para darle un nuevo contexto más general e integrarlos como parte del enfoque que en esos momentos estaba surgiendo. A pesar de que la mayoría de los primeros trabajos en esta rama fueron de origen soviético, nunca se concibió en la URSS la integración de estos trabajos como un enfoque diferente en reconocimiento de patrones y, aunque el naciente enfoque se extendió en Europa del este y los países del bloque socialista, no es común, incluso hoy en día, que se le considere como un enfoque en RP, sino como trabajos en modelado matemático. La característica más trascendente de este enfoque y seguramente la que atrae la atención de cada vez mas número e investigadores [Martínez-Trinidad-Guzmán-Arenas, 01], es que aborda problemas de clasificación y selección de variables cuya representación no es forzosamente numérica, sino que se extiende a casos que involucra descripciones de objetos y fenómenos en términos cualitativos y, sobre todo, espacios de representación que combinan tanto variables cuantitativas como cualitativas e incluso condiciones de información incompleta, imprecisa y ausencia de información [Goldfarb, 85], [PonsShulcloper-Martínez Trinidad, 02], [Shulcloper-Sánchez Díaz-Abidi, 02]. Esta característica se logra al desasociar el concepto de similitud entre patrones de las condiciones requeridas para una métrica, de esa forma se puede modelar problemas cuyo espacio de representación resulta en una complicada combinación de rasgos cualitativos y cuantitativos. Todas las características anteriores amplían considerablemente el espectro de áreas de estudio y brindan al enfoque lógico-combinatorio un enorme potencial de aplicación, no solo en las ciencias exactas y la ingeniería, sino particularmente en las humanidades, disciplinas sociales y ciencias poco formalizadas, donde la contribución de otros enfoques restringidos a espacios numéricos y métricos, ha sido mínima [López Reyes, 81], [Cheremesina-Shulcloper, 92]. Sin embargo, contrastando con su amplio espectro de investigación y enorme potencial de aplicación, este enfoque presenta también la característica de que los algoritmos tienen, por lo general complejidad alta y baja eficiencia computacional. Los resultados de estos algoritmos y sus interpretaciones son altamente sensibles a los detalles del modelado matemático, en particular, a las características del conjunto de atributos que describen los patrones, así como a las propiedades de las funciones planteadas de semejanza entre patrones [Shulcloper-Pico, 92]. 3.2.3 Enfoque Estadístico Históricamente, una de las principales herramientas que se han empleado en el reconocimiento de patrones ha sido la Estadística, la cual utiliza principalmente: Análisis 32 Capítulo Tres Marco Teórico discriminante, Teoría bayesiana de la decisión, Teoría de las Probabilidades y Análisis de Agrupamientos [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99]. El Enfoque estadístico tiene las siguientes características fundamentales: 1. Se basa en variables numéricas. 2. A estas variables se le presupone propiedades sobre un espacio métrico o normado. 3. Es muy frecuente el uso de probabilidades cuando se considera la presencia de elementos de incertidumbre. 4. Estas herramientas han sido aplicadas con muy buenos resultados a problemas principalmente de imágenes y señales. Sin embargo su uso se ha extendido indebidamente a problemas para los cuales estas herramientas no fueron concebidas [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99]. Clasificación Bayesiana El Teorema de Bayes, enunciado por Thomas Bayes en el siglo XVIII, proporciona la distribución de probabilidad condicional de un evento "A" dado otro evento "B" (probabilidad posteriori), en función de la distribución de probabilidad condicional del evento "B" dado "A" y de la distribución de probabilidad marginal del evento "A" (probabilidad simple o apriori). Sea {A1,A2,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes, tales que la probabilidad de cada uno de ellos es distinta de cero. Sea “B” un suceso cualquiera del que se conoce la probabilidad condicional P( B | Ai ) . Entonces, la probabilidad P( Ai | B) está dada por la siguiente expresión: [Lind ,Marchal, Wathen, 06] P( Ai | B)  P( B | Ai ) P ( Ai ) P( B | Ai ) P( Ai )  n P( B)  P( B | Ai )P( Ai ) i 1 Donde: P( Ai ) Es la probabilidad de que ocurra el evento Ai . P( B) Es la probabilidad de que ocurra el evento B . 33 (3.1) Capítulo Tres Marco Teórico P( B | Ai ) Es la probabilidad condicional de que ocurra el evento B dado que ya ocurrió el evento Ai . P( Ai | B) Es la probabilidad condicional de que ocurra el evento Ai dado el evento B. 3.3 Aprendizaje Inductivo El proceso de aprendizaje inductivo consiste en la generación de nuevo conocimiento después de realizar inferencia inductiva (inducción) sobre los datos proporcionados por un entorno o área de estudios [Moreno, Armengol, Béjar, 94]. Se pueden distinguir dos grandes tipos de aprendizaje inductivo: 1. Adquisición de conceptos. También conocido como aprendizaje a partir de ejemplos. Se caracteriza por que existe la descripción de algunos objetos, ya clasificados en una o más clases (Conceptos). La hipótesis que se induce puede ser vista como una regla del reconocimiento del concepto, lo anterior significa que si un objeto nuevo satisface las condiciones de la regla entonces representa al concepto dado (clases). Algunos de los problemas tratados con este tipo de aprendizaje son:  Obtención de la descripción característica de una clase de objetos, que especifica las propiedades comunes todos los objetos conocidos de la clase.  Obtención de la descripción discriminante de una clase de objetos, que la distinguen de un número limitado de clases diferentes. 2. Aprendizaje a partir de la observación. También conocida como generalización descriptiva. Su objetivo es determinar una descripción general que caracterice un conjunto de observaciones. Algunos de los problemas tratados en este tipo de aprendizaje son:  Formular una teoría que caracterice un conjunto de elementos.  Descubrir regularidades en los datos. 34 Capítulo Tres Marco Teórico A continuación se describen dos algoritmos de clasificación que emplean el aprendizaje inductivo de tipo de adquisición de datos para la construcción de definiciones inductivas. Estos algoritmos constituyen la base de la metodología de Análisis Delictivo propuesta en el presente trabajo. 3.3.1 Algoritmos tipo KORA Los algoritmos de esta familia son extensiones del original algoritmo KORA-3 desarrollado por M. Bongard para solucionar problemas de Geología y Geofísica en los años 60 [Bongard, 66]. Este algoritmo ocupa subconjuntos de rasgos descriptivos, de cardinalidad tres, para caracterizar cada una de las clases en la muestra de supervisión de un problema de clasificación supervisada. En 1998, este algoritmo es modificado y adopta el nuevo nombre de Fuzzy Kora-Ω Algorithm [De la vega, Shulcloper, 98], siendo su característica principal la de poder usar subconjuntos de rasgos de cualquier cardinalidad para la caracterización de las clases; asimismo, este algoritmo introduce nuevos umbrales que flexibilizan el tipo de caracterizaciones hechas. El algoritmo KORA-Ω, en particular su fase de aprendizaje, desempeña un papel fundamental es este trabajo de investigación, por lo que a continuación se presentan los elementos teóricos previos para su comprensión y después se presenta el algoritmo mismo. Conceptos Previos: Un conjunto O  o1 ,..., on  de objetos en estudio, definidos por un conjunto de atributos o rasgos descriptivos    x1 ,..., xr  , de manera tal que cada objeto mediante una tupla  x1 ( o i ), x 2 ( o i ),..., x r ( o i )  oi se representa llamada Patrón. Estos patrones son colocados en una muestra de supervisión donde son clasificados en un conjunto C  C1 ,..., Ck  de clases o categorías. El problema de clasificación supervisada consiste en que, dado un conjunto P   P1 ,...Ps  de patrones nuevos sin clasificar, cada patrón debe ser asignado a una de las k clases conservando las propiedades de la muestra de referencia. Los algoritmos de la familia KORA, para resolver este problema, construyen a partir de la muestra de supervisión un conjunto de definiciones inductivas que caracterizan a cada una de las clases contenidas en dicha muestra. Las definiciones inductivas se componen de rasgos complejos, que no son otra cosa más que subconjuntos    de rasgos descriptivos y sus valores asociados. En el caso del algoritmo original KORA-3 estos rasgos descriptivos (también llamados Propiedades) son exclusivamente de cardinalidad tres; en 35 Capítulo Tres Marco Teórico posteriores extensiones al algoritmo se consideran subconjuntos de cualquier cardinalidad. La familia de subconjuntos que sirven de referencia para la construcción de definiciones inductivas se denomina Familia de Conjuntos de Apoyo. Una familia de conjuntos de apoyo es un conjunto A  {1 ,  2 ,...,  g } donde  i   , i  1...g . Un Rasgo Complejo o Propiedad de una clase tiene la forma: rasgoi  rasgoi1  m Pi   ,...,      valor valor i i  1 m  Una Propiedad es Característica de una clase C i si ocurre  1 veces o más en esa clase y  1 veces o menos en las otras clases. La constate  1 se denomina Umbral Positivo de Caracterización Positiva y  1 se denomina Umbral Negativo de Caracterización Positiva, donde 0  1  min C i , 0   1  m in C i y, generalmente i i Una Propiedad es Complementaria de una clase 1  1. C i si ocurre  2 veces o más en esa clase y  2 veces o menos en las otras clases. La constate  2 se denomina Umbral Positivo de Complementariedad y  2 se denomina Umbral Negativo de Complementariedad, donde 0   2  min C i , 0   2  m in C i y, generalmente  2   2. i i Una Definición Inductiva Característica de una clase C i es la unión de todas las propiedades que son características en dicha clase:         D Ci  Pi1  Pi2  ...  Pim  3.2  De igual manera, una Definición Inductiva Complementaria, tiene la misma estructura pero está conformada por propiedades complementarias en la clase. 36 Capítulo Tres Marco Teórico Algoritmo Kora-Ω: Etapa de Aprendizaje Determinar la familia de conjuntos de apoyo 2. Determinar los valores de los umbrales  1 ,  1 1. 3. Calcular todas las propiedades características de cada clase. Etapa de re-aprendizaje 4. Determinar los valores de los umbrales  2 ,  2 5. Calcular todos los rasgos complementarios de cada clase. Etapa de clasificación 6. Esquema de Votación: para cada patrón nuevo a clasificar, contabilizar el número de propiedades que ocurren en cada una de las definiciones inductivas características y complementarias. 7. Regla de Solución: con base en el resultado anterior determinar a qué clase se asigna el nuevo patrón y con qué grado de pertenencia. Se puede encontrar más información en [De la vega, Shulcloper, 98], [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99]. 3.3.2 Algoritmo CR (Conjuntos Representantes) Este algoritmo es una idea desarrollada por Baskakova y Zhuravlëv, en la cual se trata de evaluar la evidencia disponible, a favor y en contra, de que un patrón pertenezca a una determinada clase; para ello se construyen definiciones inductivas con propiedades representantes Positivas y Negativas para cada una de las clases, así como una definición inductiva Neutra para toda la muestra de supervisión. [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99]. Las definiciones para trabajar con este algoritmo son muy similares a las expuestas en el algoritmo Kora-Ω. Los rasgos complejos característicos de una clase C i forman una definición inductiva positiva D   Ci  . 37 Capítulo Tres Marco Teórico Una Propiedad es Característica Negativa de una clase Ci si aparece  2 veces o menos en esa clase y  2 veces o más en las otras clases. La constate  2 se denomina Umbral Positivo de Caracterización Negativa y  2 se denomina Umbral Negativo de Caracterización Negativa, donde 0   2  min C i , 0   2  m in C i y, generalmente i i  2   2 . Una Definición Inductiva Negativa de una clase D   Ci  es la unión de todas las propiedades que son características negativas en dicha clase, su estructura es idéntica a la descrita en la fórmula 3.2. Una Propiedad es Neutra en la Muestra de Supervisión las clases, La constate  M S si aparece  veces en todas se denomina Umbral de Neutralidad, donde 0    min C i . i Una Definición Inductiva Neutra de la Muestra de Supervisión D 0  MS  es la unión de todas las propiedades neutras de la muestra de supervisión, su estructura es idéntica a la descrita en la fórmula 3.2. Algoritmo CR Etapa de Aprendizaje Determinar la familia de conjuntos de apoyo. 2. Determinar los valores de los umbrales  1 ,  1 1. 3. Construir una definición inductiva positiva para cada clase D   C i  . 4. Determinar los valores de los umbrales  2 ,  2 5. Construir una definición inductiva negativa para cada clase D   C i  . 6. Determinar los valores del umbral 7. Construir una definición inductiva Neutra para toda la muestra de supervisión D 0 MS  . . 38 Capítulo Tres Marco Teórico Etapa de clasificación 8. Esquema de Votación: para cada patrón nuevo a clasificar, contabilizar el número de propiedades que ocurren en cada una de las definiciones inductivas características y complementarias. 9. Regla de Solución: con base en el resultado anterior determinar a qué clase se asigna el nuevo patrón y con qué grado de pertenencia. Para mayor información revisar: [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99], [Shulcloper-Abidi, 02]. 3.4 Predicción 3.4.1 Series de Tiempo Una serie de tiempo es un conjunto de observaciones tomadas y medidas a lo largo del tiempo. Estas observaciones pueden ser hechas de manera continua o de manera discreta. [Chatfield, 00]. Un ejemplo de serie de tiempo discreta se observa en la Figura 12. Robo de Vehículo 85 46 54 52 57 44 60 50 51 52 46 31 Figura 12. Vehículos robados durante el 2008 en un Sector de Vigilancia de la ciudad de Sacramento, California, E.U.A. Los principales objetivos del área de estudio conocida como Análisis de Series de Tiempo, según [Chatfield, 00] son: 39 Capítulo Tres Marco Teórico a) Descripción. Busca explicar los datos o hecho registrados a través del tiempo mediante estadística descriptiva. b) Modelación. Determina modelos estadísticos que describan la forma en que se generan los datos a través del tiempo. c) Predicción. Estima los valores futuros de la serie con base en la información existente. d) Control. Un buena predicción de un serie de tiempo permite a los analistas tomas acciones de control sobre un proceso que está siendo analizado. Los principales componentes de una serie de tiempo según [Lind, Marchal, Wathen, 08] son: a) Tendencia secular. Es la dirección uniforme de una serie de tiempo a largo plazo. b) Variación estacional. representa la variabilidad en los datos debida a influencias de las estaciones. Esta variación corresponde a los movimientos de la serie que recurren año tras año en los mismos meses (o en los mismos trimestres) del año poco más o menos con la misma intensidad. c) Variación cíclica: Con frecuencia las series de tiempo presentan secuencias alternas de puntos abajo y arriba de la línea de tendencia que duran más de un año, esta variación se mantiene después de que se han eliminado las variaciones o tendencias estacional e irregular. d) Variación Irregular: Esta se debe a factores a corto plazo, imprevisibles y no recurrentes que afectan a la serie de tiempo. Como este componente explica la variabilidad aleatoria de la serie, es impredecible, es decir, no se puede esperar predecir su impacto sobre la serie de tiempo. Para el propósito de esta tesis, se describen a continuación, diversos métodos de predicción para series de tiempo que se emplearon para comparar la metodología de predicción propuesta. 1. Promedio Móvil El modelo de promedio móvil adopta la siguiente forma [Hanke, 08]: Yt     t  1 t 1   2 t  2  ... q t  q Donde: Yt  Es la variable de respuesta en un tiempo t.   Valor promedio que permanece constante durante todo el proceso. 40 Capítulo Tres Marco Teórico 1 ,  2 ,...,  q  Coeficientes a ser estimados durante el proceso.  t  Termino que representa en el error en un tiempo t.  t 1 ,  t  2 ,...,  t  q  Errores anteriores al tiempo t, que se incorporan a la repuesta de Yt . Este modelo proporciona predicción para la variable dependiente de Y, con base en una combinación lineal de un número finito de errores. 2. Suavizamiento Exponencial Simple. La característica principal de este método es dar (exponencialmente) mayor peso a las observaciones más recientes en la predicción que a las más antiguas. Para este método se toma en cuenta una constante de suavizamiento (α) que será determinada o estimada para asignar el peso a las observaciones. La predicción estará formada por la suma de la predicción anterior más una porción del error de la predicción. La ecuación y la definición de variables para este método son las siguientes [Janacek, 2001]: Ft 1   Yt  (1   ) F Donde Ft 1  Predicción del valor de la serie para el periodo t+1. Yt  Valor real de la serie de tiempo en el periodo t Ft  Predicción de la serie de tiempo para periodo anterior   Constate de Suavizamiento con valores entre 0 y 1. 3. Suavizamiento Exponencial Doble El suavizamiento exponencial doble también es conocido como método de Holt y su característica es que incorpora el componente de tendencia. Se llama suavizamiento exponencial doble ya que tanto la estimación del promedio de los errores como la estimación de la tendencia son suavizadas. La constante de suavizamiento α seguirá siendo para el promedio, mientras que β, será la constante de suavizamiento para la tendencia. Las fórmulas y la definición de variables para el desarrollo de este método se describen en seguida [Janacek, 2001]: Ft 1   Yt  (1   )(Yt 1  Tt 1 ) Tt   (Yt  Yt 1 )  (1   )Tt 1 41 Capítulo Tres Marco Teórico Donde: Ft 1  Predicción del valor de la serie para el periodo t+1. Yt  Valor real de la serie de tiempo en el periodo t Ft  Predicción de la serie de tiempo para periodo anterior  y   Constate de Suavizamiento con valores entre 0 y 1. 4. A.R.I.M.A. Es un modelo autorregresivo integrado de media móvil o A.R.I.M.A. (por su nombre en inglés, AutoRegressive Integrated Moving Average) es un modelo estadístico que utiliza variaciones y regresiones de datos estadísticos con el fin de encontrar patrones para una predicción hacia el futuro. Este modelo fue desarrollado a finales de los 60's. Box y Jenkins (1976) lo sistematizaron. ARIMA es un modelo con tres parámetros ARIMA  p, d , q  en donde [Janacek, 2001], [Chatfield, 00], [Hanke, 08]: p: Autoregresión d: Integración o Diferenciación q: Media Móvil Para más información acerca de los métodos de predicción mencionados anteriormente se recomienda [Chatfield, 00], [Hanke, 08] y [Lind, Marchal, Wathen, 08]. 42 CAPÍTULO CUATRO Análisis y Predicción Delictiva. Se plantea la metodología a seguir para el desarrollo del Análisis Delictivo, así como el algoritmo de predicción propuesto. 43 Capítulo Cuatro Análisis y Predicción Delictiva E n éste capítulo se presentan, los fundamentos teóricos de la metodología propuesta para análisis y predicción delictiva. En la primera parte, se muestra de manera detallada el uso de técnicas de aprendizaje inductivo descritas en el capítulo anterior, que permiten la construcción de definiciones inductivas; estas definiciones permiten determinar aquellos espacios-tiempos que son afectados de manera característica por alguna actividad delictiva. Asimismo, sienta las bases para la elaboración de recomendaciones que impactan directamente en la reasignación de recursos humanos y materiales que atiendan aquellas zonas con una incidencia delictiva mayor. Es importante señalar que la metodología propuesta tiene como base la idea de impactar primeramente en aquellas familias delictivas con presencia característica en un espacio-tiempo para posteriormente impactar en aquellas actividades que no los son y de esta manera ir reduciendo el índice delictivo de manera progresiva. Esta forma en que se pretende reducir el índice delictivo, surge de la gran escasez de recursos que actualmente tienen todos los organismos policiacos en el país, por lo que resulta casi imposible atender todas las actividades delictivas que se presentan en una región de estudio de manera simultánea. En la segunda parte se presenta la metodología de predicción empleada, con la cual se determina la cantidad de delitos que, en cada familia delictiva, se espera ocurran en un lugar determinado y en una unidad de tiempo posterior a la cubierta por el universo de estudio. Todas las recomendaciones obtenidas de la metodología para el Análisis Delictivo, así como el número de delitos que se obtiene de la predicción, establecen una base importante en la planeación y toma de decisiones de seguridad pública. La metodología propuesta permite la implementación de acciones de seguridad pública preventivas y no de reacción, lo anterior con fundamento en lo que se menciona en: “Las Políticas (o planes) de Seguridad deberían estar basadas en la prevención de las conductas antisociales, delictivas y no delictivas, más que en soluciones de tipo represivo. Es más, el problema de la seguridad debería ser abordado desde políticas sociales que contemplen en su diseño la participación activa de toda la sociedad. Los planes de prevención que no cumplen con los requisitos básicos de tener en cuenta la realidad, la dimensión social del problema, la articulación con otros planes y el monitoreo periódico, están destinados al fracaso. Pero sobre todo fracasarán si no están formulados sobre la base de un diagnóstico que esté dentro de un marco teórico adecuado” [Arango-Lara (2), 2008]. 44 Capítulo Cuatro Análisis y Predicción Delictiva 4.1 Modelo de Análisis Delictivo 4.1.1 Universo de Estudio Está integrado por diferentes hechos delictivos registrados dentro de una región de estudio y en un periodo de tiempo determinado. Para el nivel de análisis que se propone en la presente tesis es necesario que cada uno de estos hechos contenga información relativa a su ubicación espacial y temporal. 4.1.2 Proceso de Aprendizaje Antes de comenzar con el proceso de aprendizaje, es necesario introducir un nuevo concepto denominado Índice de Ocurrencia. Este índice nos permite observar qué tanto se presenta una familia delictiva dentro de un espacio-tiempo seleccionado con respecto a las otras familias. El Índice de Ocurrencia ( I ) de cada propiedad espacio-temporal ( P ) en cada clase (Ci ) o familia delictiva está dado por I Ci  P   nPCi nP 0  I Ci  P   1 (4.1) Donde nPCi es el número de ocurrencias de la propiedad ( P ) en la familia delictiva (Ci ) , y nP es el número total de ocurrencia de la propiedad ( P ) en toda la clasificación de referencia. El proceso de Análisis Delictivo comienza a partir de un universo de estudio generalmente integrado en una gran base de datos delictiva, donde cada uno de los hechos delictivos registrados en ella deben de ser representados como un patrón delictivo que consta de tres componentes: Patron Delictivo   Hecho Delictivo , Localización Espacial , Localización Temporal   Hecho delictivo.- específica el tipo de delito ocurrido (robo, violación, homicidio, etc.), así como muchas de sus características, como pueden ser el 45 Capítulo Cuatro   Análisis y Predicción Delictiva grado de violencia, número de sospechosos implicados, tipo de armamento empleado, modus operandi1, etc. Localización Espacial.- especifica en lugar donde se presentó el fenómeno delictivo (Sector de Vigilancia, colonia, calle, etc.) Ubicación Temporal.- indica en el momento en que ocurrió el hecho delictivo (año, mes, día, hora, etc.) Una vez que se tienen los patrones delictivos, el proceso de aprendizaje comienza con el desarrollo de las siguientes tres fases: construir una clasificación de referencia, construir dos definiciones inductivas, una positiva y una negativa para cada familia delictiva y, finalmente construir una definición inductiva neutra para todas las familias delictivas. A continuación cada una de estas etapas es descrita: 4.1.2.1 Construcción de una Clasificación de Referencia. Una vez que cada hecho delictivo es transformado en un patrón delictivo, el siguiente paso es construir una clasificación de referencia. Para construir esa clasificación, todos los patrones son agrupados en familias delictivas de acuerdo al tipo de medidas preventivas, materiales y recurso logísticos necesarios para prevenirlos. La selección del número y naturaleza de estas familias (clases) depende de las políticas y estrategias locales. Es importante señalar, que muchas ocasiones la clasificación jurídica de los delitos puede no ser útil para efecto de lo que se busca pues resulta más relevante crear familias delictivas que agrupen hechos delictivos que tengan en común ciertos recursos necesarios para su prevención y combate. 4.1.2.2 Construcción de definiciones inductivas. En esta etapa es necesario determinar el subconjunto de rasgos que cada patrón deberá contener para formar las propiedades que serán buscadas dentro de la clasificación de referencia. Una propiedad se define como un subconjunto de rasgos que cada patrón tiene con su respectivo valor asociado. Las propiedades deben incluir componentes espaciales y temporales: rasgoi  rasgoi1 q Pi   ,...,  valori1   valoriq 1     Expresión empleada, fundamentalmente en criminalística, para hacer referencia al modo característico de actuar de un delincuente. También en criminalística se puede interpretar como el análisis de los esquemas intelectuales, estrategias y diversas formas utilizadas comúnmente en la comisión de secuestros, robos y delincuencia organizada. 46 Capítulo Cuatro Análisis y Predicción Delictiva Una vez que las propiedades son definidas, una consulta sobre la clasificación de referencia es realizada. Todas aquellas propiedades que aparezcan más comúnmente en una clase y menos en otras son consideradas como Características positivas de la clase. La unión de propiedades características positivas de una clase (Ci ) forma una Definición Inductiva positiva de dicha clase con la siguiente estructura: C  i :  C Propiedad i 1  C Propiedad i 2   ...   C Propiedad i mi  De igual forma todas aquellas propiedades que aparezcan poco en una clase y mucho en las otras son consideradas como Características negativas de la clase. La unió de propiedades características negativas de una clase ( Ci ) forma una Definición Inductiva negativa de dicha clase con la siguiente estructura: C  i :  C Propiedad i 1  C Propiedad i 2   ...   C Propiedad i mi  La presente metodología propone la construcción de ambas definiciones inductivas para cada clase de estudio. Estas definiciones se construyen de la siguiente manera: a) Definición Inductiva Positiva D   Ci  i. Inicializar el umbral 1 (Umbral Positivo de Caracterización Positiva) entre 0 y 1. ii. Determinar el Índice de Ocurrencia  I  de cada propiedad espacio-temporal  P  en cada clase (Ci ) . iii. Todas las propiedades espacio-temporales con un Índice de Ocurrencia mayor o igual a 1 son consideradas para ser incluidas en la definición inductiva positiva. Cuando el umbral 1 se establece con valor mayor o igual a 0.51, las propiedades que conforman una definición inductiva forzosamente deben ser propiedades características, pues su Índice de Ocurrencia debió superar al umbral, garantizando con ello, que más del 50 % de ocurrencia de esa propiedad se observan en la familia delictiva caracterizada. Sin embargo, también es posible construir definiciones inductivas con propiedades no-características 47 ( ICi  P   1 ) , en cuyo caso, la Capítulo Cuatro Análisis y Predicción Delictiva propiedad ocurre en la clase caracterizada menos del 50% del total de sus ocurrencias y, por tanto, puede ser parte de la definición inductivas en más de una familia delictiva. b) Definición Inductiva Negativa D   Ci  i. Inicializar dos umbrales 2  2 (Umbral Positivo de Caracterización Negativa y Umbral de Presencia para Caracterización Negativa respectivamente) entre 0 y 1. ii. Todas las propiedades espacio-temporales con un Índice de Ocurrencia menor a un umbral 2 y con una aparición en el  2 porciento de las otras clases son incluidos en la definición inductiva de la clase. iii. El umbral 2 indica el valor máximo del Índice de Ocurrencia, que una propiedad debe tener para ser considerada como característica negativa. El umbral  2 define el mínimo porcentaje de otras clases en que la propiedad debe aparecer para ser considerada como característica negativa. 4.1.2.3 Construcción de una definición neutra D 0  MS  Todas aquellas propiedades que se presenten con un número de ocurrencias igual o similar en la mayoría de las familias delictivas son consideradas como propiedades neutras. La unión de propiedades neutras forma una Definición neutra de la clasificación de referencia (con la siguiente estructura: D : Propiedad1  Propiedad 2   ...  Propiedad m0  0 a) Inicializar dos umbrales 3 y 3 (Umbral de Holgura entre Clases y Umbral de Porcentaje de Presencia para Caracterización Neutra respectivamente) entre 0 y 1. b) Determinar el Índice de Ocurrencia ( I Ci ) de cada propiedad ( P ) en todas las clases mediante (4.1). 48 Capítulo Cuatro Análisis y Predicción Delictiva c) Determinar el valor máximo del Índice de Ocurrencia de cada propiedad en cualquier clase Max{I Ci ( P )} . Ci MS d) Para que una propiedad ( P ) sea incluida en la definición inductiva neutra, esta debe de satisfacer la siguiente condición: I Ci ( P )  3 Max{I C1 ( P )} CiMS e) Finalmente, el número de propiedades que deben cumplir la condición anterior deben de ser cuando menos 3 por ciento de todas las clases. Una vez que la etapa de análisis es terminada, las definiciones inductivas positivas, negativas y neutra son integradas de la siguiente manera: Tabla 1 Definiciones Inductivas      Propiedad   ...  Propiedad  C C1  Propiedad1 1  ...  PropiedadCm11  1 C C1 1 C1 m1 . . . . . .      Propiedad   ...  Propiedad  Ck  Propiedad C1 k  ...  Propiedad Cmkk Ck Familia Delictiva #1 Ck Familia Delictiva #k Ck mk 1  D 0  Propiedad1  ...  Propiedad m0 49  Capítulo Cuatro Análisis y Predicción Delictiva 4.1.2.4 Interpretación Con base en las definiciones inductivas obtenidas durante el proceso de aprendizaje se establecen los siguientes criterios que deben ser tomados en cuenta durante la creación de planes preventivos de seguridad pública: a) Las propiedades características contenidas en una definición inductiva positiva constituyen aquellos espacio-tiempos que son afectados por la ocurrencia, de forma característica, de alguna familia delictiva y, por lo tanto, sugieren cuándo y dónde se deben incrementar las actividades de patrullaje y vigilancia en concordancia con el tipo de actividad delictiva de que se trate. Es importante recordar que la estrategia que se plantea en la presente metodología para el Análisis Delictivo, parte de la necesidad de aprovechar de manera eficaz y eficiente los recursos económicos, humanos y materiales de que dispone la policía, por lo que primeramente se propone enfocar todos los esfuerzos policiacos a aquellos espacio-tempos característicos de cada una de las actividades delictivas y con esto logar disminuir de manera escalonada el índice delictivo dentro de la región de estudio. Esta información puede ser empleada en la planeación de acciones de seguridad pública a nivel de sectores de vigilancia. b) Las definiciones inductivas positivas, construidas con propiedades no-características, tienen la misma semántica que las descritas en el párrafo anterior (señalan las familias delictivas que deben ser atendidas de forma inmediata). Sin embargo, no expresan una necesidad tan apremiante de atención como lo haces las definiciones formadas por propiedades características. La decisión de atender más de una actividad delictiva, depende única y exclusivamente de la cantidad de recursos económicos, humanos y materiales de que dispone la policía. En tal caso, el umbral de caracterización positiva 1 (Umbral Positivo de Caracterización Positiva), debe ser establecido con un valor menor a 0.51 para lograr el efecto deseado. c) Las propiedades características negativas constituyen aquellos espacio-tiempos donde se sugiere traer recursos para atender otros que requieran una mayor atención, cabe señalar que una propiedad de este tipo solo implica que en un espacio-tiempo no ocurrirá de manera característica una actividad delictiva, pero no significa que no ocurrirán otras, por lo que la reasignación de recursos debe de ser solo aquellos destinados a atender aquellas actividades no características, sin dejar elementos necesarios de vigilancia que atiendan a otras actividades. d) Las propiedades neutras revisten una gran importancia dentro del Análisis Delictivo que se propone, ya que estas propiedades son aquellos espacio-tiempos en los cuales se presentan la mayoría de actividades delictivas y, en consecuencia, presentan 50 Capítulo Cuatro Análisis y Predicción Delictiva grandes problemas de inseguridad. Estas propiedades proponen la aplicación de campañas más intensas de vigilancia, así como la aplicación de campañas preventivas e informativas. 4.2. Predicción La metodología propuesta en esta etapa, permite predecir el número de delitos que ocurrirá, de cada una de las familias delictivas consideradas, dentro de una unidad espacial determinada (Sectores de Vigilancia, Colonias, Calles, etc.) y en la próxima unidad de tiempo contenida en la base de datos de referencia (Mes, Semana, Día), esta unidad de tiempo generalmente es el mes del año. Sin embargo es factible reducir esta unidad hasta el nivel de día, lo anterior dependerá de la frecuencia con que sean elaborados los planes preventivos de seguridad pública dentro de la región de estudios y en los cuales se incluyen las recomendaciones obtenidas de la interpretación planteadas en la sección anterior. La metodología de predicción consta de cuatro etapas: Selección de una unidad espaciotemporal a ser predicha, análisis del comportamiento histórico de la actividad delictiva en la unidad espacio-temporal durante todo el período de la base datos de referencia, análisis del comportamiento de la actividad delictiva en la unidad espacio-temporal seleccionada, pero sólo durante los últimos doce meses y, por último, la construcción de la predicción resultante. 4.2.1. Selección de la unidad espacio-temporal a predecir. Debido a la naturaleza continua de los diferentes tipos de análisis a realizar, la unidad de tiempo a ser predicha debe de ser siempre la subsecuente a la contenida en la base de datos de referencia. Por lo que únicamente se debe seleccionar la unida espacial a pronosticar. 4.2.2. Análisis Histórico Este análisis plantea que en ciertos periodos del año algunas familias delictivas son más comunes que otras y que además tiende a comportarse casi de manera periódica a través de los años. Para realizar el análisis, todos los delitos de cada familia delictiva son seleccionados y contados dentro de la unidad espacio-temporal seleccionada y en cada uno de los años de toda la base de datos de referencia. 51 Capítulo Cuatro 4.2.3. Análisis y Predicción Delictiva Análisis del los 12 últimos meses Este análisis se desarrolla de manera similar al descrito en el párrafo anterior, con la diferencia de que los delitos de cada familia delictiva son seleccionados y contados dentro de la unidad espacial seleccionada durante los últimos 12 últimos meses de la base de datos de referencia. Lo anterior con el objeto de determinar la tendencia que actualmente tiene cada familia delictiva en el espacio seleccionado. 4.2.4. Predicción Final El número de delitos predichos ( F ) , pertenecientes a la familia delictiva ( c ), observados dentro de la unidad espacial ( s ) y durante la unidad de tiempo ( t ), está determinado por: F  c, s , t     f ( c, s , t )     g ( c, s , t )  (4.2) Donde: f ( c, s , t ) Predicción parcial obtenida del análisis histórico de delitos, de cada familia delictiva, observados dentro de la unidad espacio-temporal seleccionada, pero durante la misma unidad de tiempo (usualmente el mes de la año) de cada año disponible en la base de datos de referencia. La unidad en que se expresa esta predicción es número de delitos. g (c, s, t ) Predicción parcial obtenida del análisis de delitos (misma familia delictiva y misma unidad espacial) observados durante los 12 últimos meses en la base de datos de referencia. La unidad en que se expresa esta predicción es número de delitos. ,  Valores de ponderación asignados a cada una de las predicciones anteriores. El propósito de las dos predicciones parciales es aproximar la tendencia observada en el espacio-tiempo seleccionado. Cuando la tendencia es conocida es posible predecir el siguiente valor únicamente con observar el último valor en la base de datos de referencia. Para alcanzar esta predicción la herramienta básica a ser usada es simplemente una consulta a la base de datos para contar el número de delitos, de una familia delictiva especifica ( c ) y observada dentro un espacio y tiempo especifico ( s , t ). 52 Capítulo Cuatro Análisis y Predicción Delictiva Sea  ( t )  número de delitos, de una familia delictiva especifica ( c ) y observada dentro un espacio y tiempo especifico ( s , t ). Se tiene que ambas predicciones parciales pueden ser expresadas como: f  c, s , t    (t  1)  1 K1 último año   (t  p )   (t  p  1)  p  primer año 1 g  c , s , t    (t  1)  K1 (4.3) 11   (t  p )   (t  p  1)  p 1 (4.4) Donde K 1 y K 2 son igual a la suma de cambios en el incremento y decremento en el número de delitos a través del tiempo. 53 CAPÍTULO CINCO Resultados experimentales. Se detallan los resultados obtenidos de diferentes experimentos realizados siguiendo la metodología para el Análisis y Predicción Delictiva propuesta. 42 Capítulo Cinco 5.1 Resultados Experimentales Universo de Estudio Para los experimentos realizados en esta sección, se empleó como universo de estudio una base de datos de hechos delictivos registrados en la ciudad de Sacramento, en el estado de California, E.U.A. Esta información se encuentra disponible para el público en general a través de la página de su departamento de policía en http://www.sacpd.org/crime/stats/reports/. 5.1.1 Sacramento, California, E.U.A. Sacramento es la capital del estado de California, en los Estados Unidos. Situada en el interior, al Norte del Área de la Bahía de San Francisco, es de menor tamaño e importancia económica que Los Ángeles, San Francisco, San Diego y San José las otras cuatro principales ciudades californianas. Según el censo de 2000 tenía una población de 407.018 habitantes, en 2005 contaba con 456.4411 y en 2007 de 467.343, en la actualidad cuenta con una población estimada de 486,990. Es la séptima ciudad más poblada de California. Figura 13. Mapa de Sacramento, California E.U.A. 55 Capítulo Cinco Resultados Experimentales 5.1.2 Consideraciones importantes sobre la base de datos La base de datos contiene información delictiva desde enero del 1997 hasta el mes mayo del 2009. Los hechos delictivos contenidos en la base de datos empleada contiene la siguiente información:  Hecho delictivo. Contiene información relativa al tipo de delito que aconteció (Robo, Violación, Homicidio, etc.).  Ubicación Temporal. Cada uno de los hechos delictivos están ubicados en tiempo con suficiente nivel de detalle (año, mes, día y hora).  Ubicación Espacial. Cada uno de los hechos delictivos están ubicados en espacio con suficiente nivel de detalle (Distritos, Beats, Grids y coordenadas en “x” y “y”). Sobre este aspecto, el departamento de policía de Sacramento, para ubicar en espacio cada hecho delictivo, divide el mapa de la ciudad en seis (6) distritos. Los distritos a su vez son divididos en sectores de vigilancia denominados “Beats”, a los cuales son asignados las patrullas de vigilancia (19 Beats en total); cada sector o Beat es a su vez dividido en subsectores más pequeños denominados “Grids”. La Figura 14 muestra esta división territorial. Con respecto al párrafo anterior, es conveniente señalar que en México un problema con el que se enfrentas las oficinas de Análisis Delictivo, es que en cada nueva administración política tiende a cambiar sus sectores de vigilancia dentro de una determinada región, esto provoca que un delito que fue ubicado en un Sector de Vigilancia en una administración anterior, no corresponda con la actual división sectorial. Esto provoca que sea muy difícil establecer una tendencia correcta del comportamiento de una familia delictiva dentro de una región de estudio. Esta situación es manejada de una forma muy sencilla en el departamento de policía del Sacramento al dividir todo el territorio en “Grids”, esta última división es fija y nunca cambia, lo que permite que aunque existan múltiples reasignaciones de sectores de vigilancia, cada hecho delictivo se puede ubicar mediante su “Grid”. El Departamento de policía de Sacramento, establece, que el margen de error existente en su base de datos es aproximadamente del 10 %, debido a que los datos son producidos a través de un conjunto de procesos muy complejos. Sin embargo, se desconoce el método específico para calcular dicho margen de error. 56 Capítulo Cinco Resultados Experimentales Figura 14. División Territorial por sectores de vigilancia de la ciudad de Sacramento, california, E.U.A. 57 Capítulo Cinco Resultados Experimentales A continuación se describen diversos experimentos realizados, con el propósito de probar la metodología de predicción delictiva propuesta. 5.2 Análisis Delictivo (Experimento 1) 5.2.1 Objetivo del experimento 1 Aplicar la metodología propuesta de Análisis Delictivo para determinar lo siguiente: 1. Cuáles son las familias delictivas que están ocurriendo de manera notable (característica o no-característica) dentro de la región de estudio. 2. Cuáles son las épocas del año y horarios en que estas actividades delictivas son más propensas a cometerse. 3. Los espacio-tiempos de los cuales es posible extraer recursos humanos y materiales para reasignar a la prevención de familias delictivas que están ocurriendo de manera notables (característica o no-característica). 4. Finalmente, cuáles son los espacio-tiempos en donde se presentan la mayoría de las familias delictivas. Para probar la metodología, se emplearon 152,802 hechos delictivos registrados en la base de datos de referencia durante el periodo de Enero del 2004 a diciembre de 2009. 5.2.2 Construcción de una clasificación de referencia Se seleccionaron las 16 familias delictivas con más cantidad de hechos delictivos e impacto en la sociedad para ser consideradas como clases delictivas dentro del experimento. Cada uno de los hechos delictivos fue convertido en patrones delictivos y agrupados dentro de una clase delictiva. a. La unidad espacial empleada para cada patrón delictivo fue el Sector de Vigilancia. b. Las unidades de tiempo empleadas para cada patrón delictivo fueron el mes del año y el octante horario. Este último se determina dividiendo las 24 horas del día en ocho octantes de tres horas cada uno y sustituyendo la hora del hecho delictivo por el Octante Horario que le corresponda. En la Tabla 2 se muestran los Octantes Horarios resultantes. 58 Capítulo Cinco Resultados Experimentales Cada patrón delictivo quedo formado de la siguiente forma: Sector de Vigilancia, Mes, Octante Horario PCi    1A, 8 Enero,   Tabla 2 Octantes horarios Octante Horario Horas Cubiertas 1 (00:01-03:00 hrs) 2 (03:01-06:00 hrs) 3 (06:01-09:00 hrs) 4 (09:01-12:00 hrs) 5 (12:01-15:00 hrs) 6 (15:01-18:00 hrs) 7 (18:01-21:00 hrs) 8 (21:01-00:00 hrs) En la Tabla 3 se muestran las familias delictivas empleadas y el número de patrones delictivos agrupados en cada una de ellas. Tabla 3 Familias delictivas y sus patrones No. de Clase Clase Delictiva No de Patrones 1 Robo de Vehículo 28,816 2 Robo 451 3 Robo a casa habitación 18,735 4 Robo a negocio 7,827 5 Vandalismo de poco Impacto < 400 dólares 10,269 6 Vandalismo de Gran Impacto > 400 dólares 5,229 7 Asalto de poco Impacto (Robo Hormiga) 27,934 8 Asalto de gran Impacto 6,583 9 Accidentes de Trafico 10,610 10 Delitos Sexuales 3,439 11 Violencia Domestica 11,614 12 Actividades de Pandilla 3,005 13 Delitos relacionados con armas 7,233 14 Homicidio 348 15 Riñas 5,695 16 Delitos Contra la Salud 5,014 Total 152,802 59 Capítulo Cinco 5.2.4 Resultados Experimentales Construcción de definiciones inductivas En la Tabla 4 se muestran los umbrales empleados en la construcción de las definiciones inductivas: Tabla 4 Umbrales empleados en la construcción de definiciones inductivas. Umbral 1 (Umbral Positivo de Caracterización Positiva)  2 (Umbral Positivo de Caracterización Negativa)  2 (Umbral de Presencia para Caracterización Negativa) Valor 0.40 0 0.80 3 ((Umbral de Holgura entre Clases) 0.65 3 (Umbral de Porcentaje de Presencia para Caracterización Neutra) 0.45 Usando la metodología propuesta en el capitulo anterior, fueron encontradas todas las propiedades espacio-temporales características positivas y negativas de cada una de las familias delictivas, así como el número de sectores de vigilancia en que estas familias son características. La Tabla 5 muestra estos resultados. Finalmente, las propiedades espacio-temporales neutras de todas las familias delictivas fueron encontradas. La Tabla 6 muestra estos resultados. 5.2.5 Conclusiones del Experimento 1 Algunas de las conclusiones que se pueden obtener de la experimentación realizada son las siguientes: a. De la Tabla 5 se puede determinar que las familias delictivas que tienen mayor impacto en la ciudad de Sacramento, California, E.U.A. son: el robo de vehículo y el robo a casa habitación. El robo de vehículo afecta de manera característica a 8 Sectores de Vigilancia mientras que el robo a casa habitación a 10 de ellos. Estas actividades suceden de manera característica en todo el año. Los octantes horarios más comunes para el robo de vehículo son: 1, 2, 7 y 8, es decir en un horario de entre de las 6 de la tarde y las 6 de la mañana. b. Por otra parte, en la misma tabla se aprecia que otras actividades delictivas importantes son: el robo a negocio y el robo de poco impacto, este último afecta fuertemente sólo a dos sectores de vigilancia, durante todo el año y en un horario de entre las 9 de la mañana y 9 de la noche. 60 Capítulo Cinco Resultados Experimentales c. Igualmente, es posible observar que existen 27 propiedades características negativas de la clase de robo a casa habitación y 878 de la clase de homicidio, que nos indican espacio-tiempos en donde no suceden de manera característica estas actividades delictivas y por lo tanto es posible reasignar recursos humanos y materiales a otros espacio-tiempos donde se requieran. d. Finalmente, es importante señalar que las conclusiones obtenidas se obtienen de manera directa del resumen de propiedades características positivas y negativas encontradas. Sin embargo, es posible conseguir conclusiones más específicas como el mes del año en que es más común el robo de vehículo. Esto último se logra analizando de manera detallada cada una las propiedades espaciotemporales obtenidas en la experimentación. Tabla 5 Número de propiedades espacio-temporales características positivas y negativas encontradas. Familia Delictiva # de # de Propiedades Propiedades Características Características Positivas Negativas Sectores de Meses en que Vigilancia en la familia que la familia delictiva es delictiva es característica. característica. 1A, 1B, 2C, 3B, 3C, 3M, 4A, 4C 0 1C, 2B, 4A, 4B, 4C, 5A, 5B, 5C 6A, 6B Todos los meses del año Octantes Horarios en que la familia delictiva es característica Robo de Vehículo 41 5 Robo 0 802 Robo a casa habitación 27 27 Robo a negocio 2 68 3M, 6C Agosto y Febrero 2 0 8 0 0 0 0 63 0 0 0 43 0 2C, 3M 0 0 0 0 0 0 0 0 0 32 30 108 5 288 13 878 37 130 0 0 0 0 0 0 0 0 0 Vandalismo de poco Impacto < 400 dólares Vandalismo de Gran Impacto > 400 dólares Asalto de poco Impacto (Robo Hormiga) Asalto de gran Impacto Accidentes de Trafico Delitos Sexuales Violencia Domestica Actividades de Pandilla Delitos relacionados con armas Homicidio Riñas Delitos Contra la Salud 61 0 Todos los meses del año Todos los meses del año 0 0 0 0 0 0 0 0 0 1, 2, 7 Y 8 0 3,4 Y 5 4,5,6,7 0 0 0 0 0 0 0 0 0 Capítulo Cinco Resultados Experimentales Tabla 6 Espacio-tiempos afectados por la mayoría de las familias delictivas Sector de # de Familias Delictivas que Mes Octante Horario Vigilancia (Beat) afectan al espacio-tiempo 3A 2B 2B 1C 6A 2B 6C 3A 1C 6B 2B 2A 2B 3A 6A 5A 3M 5.3 Febrero Marzo Marzo Mayo Junio Julio Agosto Abril Mayo Junio Agosto Noviembre Diciembre Diciembre Noviembre Enero Abril 2 7 8 8 8 1 6 7 2 2 2 2 1 2 1 2 2 7 10 6 9 8 7 7 10 6 10 8 6 9 6 9 9 7 Predicción delictiva (Experimento 2, 3 y 4) 5.3.1 Experimento 2 5.3.1.1 Objetivo del experimento 2 El objetivo principal del presente experimento consistió en probar y evaluar sobre los meses de enero, febrero, marzo y abril del 2009 de la base de datos de Sacramento, la metodología de predicción propuesta. 5.3.1.2 Selección de la unidad espacio-temporal a predecir En este experimento se seleccionaron como unidades espaciales los 19 sectores de vigilancia (beats) que conforman al estado de Sacramento y como unidad temporal el mes del año. 5.3.1.3 Análisis Histórico Para este análisis se ocuparon 5 años de hechos delictivos obtenidos de la base de datos de referencia. Para predecir enero del 2009, se emplearon datos de enero del 2004 a diciembre del 2008; para predecir febrero del 2009 los datos empleados fueron de febrero del 2004 a enero del 2009, y así sucesivamente para los 4 meses en que se realizó la predicción. 62 Capítulo Cinco Resultados Experimentales 5.3.1.4 Análisis del los 12 últimos meses Para este análisis únicamente se ocuparon los 12 meses anteriores a cada uno de los meses a predecir. Para enero del 2009, los hechos delictivos seleccionados fueron tomados de enero del 2008 a diciembre del 2008, Para febrero del 2009, los hechos fueron de febrero del 2008 a enero del 2009, y así sucesivamente. 5.3.1.5 Predicción Final La predicción se realizó para todas las familias delictivas y en cada una de las propiedades espacio-temporales seleccionadas. Los valores de los pesos asignados a cada uno de los análisis anteriores fue: para el análisis histórico,  = 0.2 y para el análisis de los 12 últimos meses  = 0.8. Estos valores se obtuvieron mediante experimentación. 5.3.1.6 Evaluación del experimento 2 Para evaluar los resultados de la predicción realizada a cada propiedad espacio-temporal se empleó el Error Cuadrático Medio definido por: N ECM  e p 1 2 p N (5.1) Donde: e p  Y p  Pp , Yp es la cantidad de delitos que ocurrieron de manera real en el espaciotiempo seleccionado y Pp es la cantidad de delitos predichos por la metodología. En las Tablas 7, 8, 9 y 10 se muestran de manera general los resultados obtenidos en la predicción realizada con la metodología propuesta sobre todas las familias delictivas y en todos los espacios en los mese de enero, febrero, marzo y abril del 2009. Finalmente, en la Tabla 11 Se muestra el resumen general de Errores Cuadráticos Medios obtenidos por la metodología para cada uno de los meses en los que fue empleado. 63 Capítulo Cinco Resultados Experimentales Tabla 7 Predicción realizada sobre enero del 2009 Familia delictiva Robo de Vehículo Robo Robo a casa habitación Robo a negocio Vandalismo de poco Impacto < 400 dólares Vandalismo de Gran Impacto > 400 dólares Asalto de poco Impacto (Robo Hormiga) Asalto de gran Impacto Accidentes de Trafico Delitos Sexuales Violencia Domestica Actividades de Pandilla Delitos relacionados con armas Homicidio Riñas Delitos Contra la Salud Total 417 11 328 135 # de delitos predichos por la Metodología propuesta 384 6 343 118 108 129 3.61 13.00 80 63 3 9.00 449 93 170 51 152 51 393 107 194 48 185 31 8.2 2.1 3.43 1.85 3.27 2.08 67.26 4.42 11.79 3.42 10.68 4.32 105 2 67 57 2,276 82 6 52 50 2,191 3.05 0.73 2.42 2.61 56.95* 9.32 0.53 5.84 6.79 299.21* # real de delitos cometidos (Ene-2009) Error Medio Predicción propuesta. (ECM) 10.04 1.15 6.48 2.93 100.89 1.32 42.05 8.58 * Para obtener el ECM y el Error Medio, es necesario que el valor mostrado sea dividido entre las 16 familias delictivas. En la Tabla 5.11 se muestran estos resultados. Tabla 8 Predicción realizada sobre febrero del 2009 Familia delictiva Robo de Vehículo Robo Robo a casa habitación Robo a negocio Vandalismo de poco Impacto < 400 dólares Vandalismo de Gran Impacto > 400 dólares Asalto de poco Impacto (Robo Hormiga) Asalto de gran Impacto Accidentes de Trafico Delitos Sexuales Violencia Domestica Actividades de Pandilla Delitos relacionados con armas Homicidio Riñas Delitos Contra la Salud Total 415 5 294 89 # de delitos predichos por la Metodología propuesta 402 11 325 127 152 114 4.12 16.95 61 79 2.45 6.00 403 86 159 39 159 60 432 95 174 46 159 49 7.83 3.44 3 1.99 2.6 1.91 61.32 11.84 9.00 3.95 6.74 3.63 88 1 57 51 2,119 100 2 65 59 2,239 2.38 0.4 2.49 1.97 50.33* 5.68 0.16 6.21 3.89 214.42* # real de delitos cometidos (Feb-2009) Error Medio Predicción propuesta. (ECM) 6.31 1.12 5.44 2.88 39.84 1.26 29.63 8.32 * Para obtener el ECM y el Error Medio, es necesario que el valor mostrado sea dividido entre las 16 familias delictivas. En la Tabla 5.11 se muestran estos resultados. 64 Capítulo Cinco Resultados Experimentales Tabla 9 Predicción realizada sobre marzo del 2009 Familia delictiva Robo de Vehículo Robo Robo a casa habitación Robo a negocio Vandalismo de poco Impacto < 400 dólares Vandalismo de Gran Impacto > 400 dólares Asalto de poco Impacto (Robo Hormiga) Asalto de gran Impacto Accidentes de Trafico Delitos Sexuales Violencia Domestica Actividades de Pandilla Delitos relacionados con armas Homicidio Riñas Delitos Contra la Salud Total 385 7 385 97 # de delitos predichos por la Metodología propuesta 409 6 301 92 144 155 4.08 16.68 62 65 2.82 7.95 450 99 175 63 162 57 407 94 158 45 165 57 5.47 2.72 3.3 2.6 3.49 2.1 29.95 7.42 10.89 6.74 12.16 4.42 98 1 74 55 2,314 87 2 59 55 2,157 2.87 0.4 2.58 2.15 56.91* 8.26 0.16 6.68 4.63 285.84* # real de delitos cometidos (Mar-2009) Error Medio Predicción propuesta. (ECM) 8.89 1 8.71 3.73 79.05 1.00 75.89 13.95 * Para obtener el ECM y el Error Medio, es necesario que el valor mostrado sea dividido entre las 16 familias delictivas. En la Tabla 5.11 se muestran estos resultados. Tabla 10 Predicción realizada sobre abril del 2009 Familia delictiva Robo de Vehículo Robo Robo a casa habitación Robo a negocio Vandalismo de poco Impacto < 400 dólares Vandalismo de Gran Impacto > 400 dólares Asalto de poco Impacto (Robo Hormiga) Asalto de gran Impacto Accidentes de Trafico Delitos Sexuales Violencia Domestica Actividades de Pandilla Delitos relacionados con armas Homicidio Riñas Delitos Contra la Salud Total 362 9 314 76 # de delitos predichos por la Metodología propuesta 378 7 374 97 158 148 4.58 20.95 90 67 3.1 9.63 392 113 186 50 180 50 444 104 169 55 166 61 5.09 3.14 5.37 2.65 3.77 3.2 25.89 9.84 28.89 7.00 14.21 10.26 80 4 78 58 2,200 97 1 74 57 2,299 2.93 0.4 2 3.19 58.66* 8.58 0.16 4.00 10.16 274.47* # real de delitos cometidos (Abr-2009) Error Medio Predicción propuesta. (ECM) 7.74 0.97 7.33 3.2 59.89 0.95 53.79 10.26 * Para obtener el ECM y el Error Medio, es necesario que el valor mostrado sea dividido entre las 16 familias delictivas. En la Tabla 5.11 se muestran estos resultados. 65 Capítulo Cinco Resultados Experimentales Tabla 11 ECM general para cada uno de los meses predichos. Mes Enero 2009 Febrero 2009 Marzo 2009 Abril 2009 Error Medio 4.32 3.66 4.23 4.14 ECM 18.70 13.40 17.86 17.15 5.3.1.7 Conclusiones del experimento 2 Los resultados obtenidos en la experimentación muestran que la metodología propuesta tiene una alta efectividad en la predicción de delitos, con un ECM máximo para el mes de enero de 18.70 y un mínimo de 13.40 para el mes de febrero. Este resultado significa que, en promedio, la metodología falla en menos de 5 ocurrencias por cada familia delictiva en la predicción de cada mes. Esta precisión es más que aceptable para cualquier sistema automático de predicción delictiva. 5.3.2 Experimento 3 5.3.2.1 Objetivo del experimento 3 El objetivo del presente experimento consiste determinar el grado de tolerancia de la metodología de predicción propuesta cuando se cuenta con menos años en la base de datos de referencia. La predicción fue hecha sobre el mes de febrero del 2009. Para este experimento, la selección de la unidad espacio-temporal a predecir, el análisis del los 12 últimos meses y los valores de los pesos asignados a cada uno de los análisis continúan de la misma manera a la expuesta en el experimento anterior. 5.3.2.2 Análisis Histórico En este experimento, el análisis se realizó reduciendo la cantidad de años tomados de la base de datos de referencia. Primeramente se emplearon solo 4 años (Enero del 2005 a diciembre del 2008), después 3 años (Enero del 2006 a diciembre del 2008), y así sucesivamente hasta emplear solo el último año de la base de datos. 5.3.2.3 Evaluación del experimento 3. Los resultados obtenidos de la experimentación se muestran en la Tabla 12. 66 Capítulo Cinco Resultados Experimentales Tabla 12 ECM obtenido al reducir la cantidad de años en la base de datos de referencia # de años tomados de la base de datos de referencia 4 años (2005-2008) 3 años (2006-2008) 2 años (2007-2008) 1 año (2008) Error Medio ECM (Febrero 2009) 3.67 3.67 3.69 3.7 13.50 13.50 13.60 13.70 5.3.2.4 Conclusiones del experimento 3 Los resultados obtenidos en la experimentación demuestran que la metodología de predicción propuesta tiene una alta tolerancia a la reducción de datos al pasar de un ECM de 13.50 utilizando 4 años de la muestra a 13.70 utilizando solo uno. Lo anterior permite demostrar que la metodología arroja buenos resultados con un año de la base de datos de referencia. Sin embargo el procesamiento que se emplea es muy poco y por lo tanto es recomendable llevarlo a cabo con la mayor cantidad de datos disponibles. 5.3.3 Experimento 4 5.3.3.1 Objetivo del experimento 4 Con base en los resultados obtenidos en el experimento anterior, podría suponerse que el análisis histórico que se propone en la metodología de predicción podría descartarse, ya que el ECM aumenta muy poco cuando se emplea un año en este análisis. El objetivo de este experimento consiste determinar que tanto influye en los resultados de la metodología de predicción propuesta si no se considera el análisis histórico. La predicción fue hecha sobre el mes de febrero del 2009. Para este experimento, la selección de la unidad espacio-temporal a predecir, el análisis del los 12 últimos meses y los valores de los pesos asignados a cada uno de los análisis continúan de la misma manera a la expuesta en el experimento 2. 5.3.3.2 Evaluación del experimento 4 Los resultados obtenidos de la experimentación se muestran en la tabla 13. Tabla 13 ECM obtenido al no considerarse el análisis histórico ECM (Febrero 2009) 16.99 Error Medio 4.12 67 Capítulo Cinco Resultados Experimentales 5.3.3.3 Conclusiones del experimento 4 Los resultados obtenidos en la experimentación demuestran que la metodología de predicción propuesta incrementa de manera considerable su ECM de 13.50 a 16.99 cuando no se utiliza el análisis histórico. Lo que permite concluir que este análisis es necesario. Además representa un costo computacional muy bajo para el sistema al requerir trabajar solo con un dato por cada año de la base de datos de referencia. 5.3.4 Experimento 5 5.3.4.1 Objetivo del experimento 5 Este experimento tuvo como objetivo comparar la metodología de predicción propuesta con los siguientes algoritmos empleados en el análisis y predicción de series de tiempo: 1. Probabilidad Bayesiana 2. Promedio Móvil (Calculado con MINITAB versión 15). 3. Suavizamiento Exponencial Doble (Calculado con MINITAB versión 15). 4. ARIMA (Calculado con MINITAB versión 15). 5.3.4.2 Consideraciones especiales A fin de poder comparar de manera equitativa varios métodos de análisis y predicción de Series de tiempo fue necesario tomar en cuenta lo siguiente:  Cada algoritmo trabajo con 60 datos. Cada dato corresponde al número de hechos delictivos de cada familia, presentados en un espacio seleccionado (Sector de Vigilancia) en cada uno de los meses de todo el universo de estudio (de enero del 2004 a Diciembre del 2008).  La predicción fue hecha sobre enero y febrero del 2009. 5.3.4.3 Análisis del los 12 últimos meses La metodología de predicción propuesta únicamente ocupa los 12 meses anteriores a cada uno de los meses a predecir. Sin embargo, a fin de trabajar con la misma cantidad de datos que los otros algoritmos propuestos se realizaron los siguientes cambios sobre la metodología propuesta: 1. El universo de estudio empleado se divide en años. 2. En cada año se realiza el análisis de los 12 últimos meses a fin de predecir el mes propuesto en cada año. 68 Capítulo Cinco Resultados Experimentales 3. Se determina la predicción ponderada parcial mediante: último año  Pp  i Primer año i .g (c, s, ti ) i (5.2) Donde: Pp  Al promedio ponderado de la predicción realizada en el mes seleccionado en todos los años del universo de estudio. i = A una ponderación que se le da a la predicción realizada cada año del universo de estudio. Entre más reciente sea el año recibe ponderaciones más altas. 4. Finalmente, se determina el error obtenido en cada una de las predicciones realizadas a través de todo el universo de estudio mediante: ep  último año  i  Primer año (Yi  g (c, s, ti )) (5.3) Donde: e p  Al error obtenido en cada una de la predicciones parciales realizadas en todo el universo de estudio. Y= a la cantidad de hecho delictivos ocurridos realmente en el mes y año seleccionado. 5.3.4.4 Predicción Final La predicción final está dada por la siguiente fórmula: PF =Pp  (.ep ) 69 (5.4) Capítulo Cinco Resultados Experimentales Donde:  = a un factor que permite determinar el porcentaje de error que se le suma a la predicción ponderada parcial a fin de obtener un mejor resultado.  Toma valores entre 0 y 1. 5.3.4.5 Predicción bayesiana La predicción bayesiana se realiza de la siguiente forma: 1) Haciendo uso del Teorema de Bayes, se calcula la probabilidad condicional de que, delitos de una familia delictiva específica ocurran en un espacio-tiempo dado. 2) La probabilidad obtenida en el paso anterior se multiplica por el número promedio de delitos, de cualquier familia delictiva, que ocurren en el espacio de referencia y durante todos los meses contenidos en la muestra. 3) El producto así obtenido se interpreta como el número de delitos, de la familia delictiva estudiada, que se predice ocurrirán, en el espacio y durante el tiempo referidos. 5.3.4.6 Evaluación del experimento 5 La metodología de predicción propuesta emplea los siguientes parámetros:   0.5   2005  0.10,  2006  0.15,  2007  0.20,  2008  0.25,  2009  0.30  Los resultados obtenidos de la experimentación se muestran en la tabla 14. Tabla 14 ECM obtenido de cada uno de los algoritmos de predicción propuestos Algoritmo de predicción Promedio Móvil MA(3) Suavizamiento Exponencial Doble ARIMA (2,1,2) Bayes Metodología Propuesta SIAPD Error Medio (Enero 2009) 3.99 ECM (Enero 2009) 15.90 4.33 18.77 3.91 4.24 3.66 70 Error Medio (Febrero 2009) 3.99 ECM (Febrero 2009) 15.94 15.34 15.25 17.96 3.92 3.99 4.42 15.91 19.50 13.40 3.59 12.91 Capítulo Cinco Resultados Experimentales 5.3.4.7 Conclusiones del experimento 5 Los resultados obtenidos en la experimentación muestran que la metodología de predicción propuesta presenta un buen desempeño en comparación con otros algoritmos de predicción empleados de manera clásica en este tipo de problemas. Por otra parte se muestra que la metodología mejora de manera considerable al utilizar diferentes predicciones parciales y la inclusión del error en la predicción final, disminuyendo el ECM que se tenía de 18.70 a 13.40 para el mes de enero del 2009 y de 13.50 a 12.91 para el mes de febrero del 2009. Resulta relevante observar, en los resultados de este experimento, que no necesariamente se tiene que trabajar únicamente con un solo algoritmo de predicción; el uso combinado de varios de estos algoritmos puede arrojar información relevante para el analista delictivo, tal es el caso de la predicción realizada sobre el mes de Enero del 2009 para el Sector de Vigilancia 3A, en el cual, la predicción resultante en cada uno de los cinco métodos empleados, es notoriamente semejante; sin embargo, el número real de delitos ocurridos resulto muy superior a todos las predicciones realizadas. En la Tabla 15 se muestran esta situación. Tabla 15 Número de delitos predichos por cada algoritmo para el mes de enero del 2009 en el Sector de Vigilancia 3A Algoritmo de Predicción # de delitos predichos por cada algoritmo # de delitos ocurridos realmente 17 Promedio Móvil Suavizamiento Exponencial Doble 18 ARIMA 19 Bayes 17 SIAPD 18 32 Como podemos observar en la tabla anterior, todos los algoritmos predijeron un número similar de delitos. Sin embargo, la cantidad real que se presento es casi el doble de lo predicho, esto le muestra claramente al Analista Delictivo la posibilidad de que ese espaciotiempo haya existido un factor político, social, económico, etc. que haya tenido como consecuencia un cambio notorio en la tendencia de comportamiento de la actividad delictiva. 71 CAPÍTULO SEIS Desarrollo de Aplicación. Se detallan los aspectos relacionados al desarrollo de una aplicación informática que permita probar la metodología de Análisis y Predicción Delictiva (SIAPD) propuesta. 72 Capítulo Seis Desarrollo de Aplicación E n el presente capitulo, se detallan los aspectos de diseño e implementación de una aplicación informática que permita incorporar y probar la metodología de Análisis y Predicción Delictiva propuesta. La construcción de la aplicación tiene como propósito permitir la realización de pruebas de funcionamiento de la metodología teórica propuesta. La metodología fue probada e implementada primeramente utilizando el lenguaje técnico de computación “Matlab”. Sin embargo, este lenguaje matemático generalmente no permite la visualización de resultados a través una intranet o de internet. Esta visualización es necesaria para convertir la metodología propuesta en una verdadera herramienta de Análisis y Predicción Delictiva que proporcione información de manera descentralizada a cada uno de los elementos encargados de la elaboración de planes de seguridad pública dentro de sus áreas de su responsabilidad. Estas áreas generalmente serán los sectores de vigilancia en que es dividida la región de estudio y en donde se desarrollan las actividades de patrullaje tendiente a disminuir el índice delictivo. Con base en lo anterior, fue necesario diseñar y construir una aplicación informática que incorpora la metodología de Análisis y Predicción delictiva con las siguientes características: 1. Funciona dentro de una arquitectura cliente-servidor, a fin de que los resultados obtenidos de cada uno de los diferentes análisis se encuentren disponibles en todo momento, para múltiples usuarios y desde diferentes locaciones. 2. Toda la información delictiva histórica empleada en cada uno de los procesos señalados, así como aquella que se vaya generando después de haberse implementado la aplicación sea administrada de manera centralizada mediante una base de datos. 3. Cada uno de los análisis propuestos deben de estar desarrollados de manera modular para facilitar su administración, mejoramiento y facilidad de uso por parte de los usuarios. 4. Cuenta con interfaces de usuario que permitan la configuración de diferentes parámetros necesarios para los análisis. A continuación se describe la forma en que la aplicación fue desarrollada para cumplir con las características descritas arriba. 73 Capítulo Seis 6.1 Desarrollo de Aplicación Arquitectura cliente-servidor La arquitectura del SIAPD responde al modelo general denominado cliente-servidor. Esto significa que en el mayor nivel de abstracción el sistema está compuesto por dos subsistemas: el primero de ellos, denominado servidor, realiza el contacto con la base de datos, lleva a cabo los procesos de Análisis y Predicción delictiva y la elaboración de reportes finales. El segundo sub-sistema, denominado cliente, tiene como función el de proporcionar una interfaz con los usuarios. Gracias a esta división de actividades entre los dos sub-sistemas, es posible dividir el sistema de forma tal que ambos sub-sistemas se encuentren ubicados en computadoras diferentes que pueden o no encontrarse físicamente en la misma ubicación. El mecanismo de comunicación y sincronización entre los sub-sistemas es el protocolo http usado hoy en día para la comunicación en la Internet. Esto posibilita que, de acuerdo a la arquitectura de SIAPD, el sub-sistema servidor sea instalado en una computadora con mayor capacidad de procesamiento, almacenamiento y con conexión hacia la Internet, o si se prefiere en una Intranet, mientras que el sub-sistema cliente se puede encontrar en una o varias computadoras de menor capacidad y costo. La base de datos y los programas que analizan los datos se encontrara en el sub-sistema servidor. Cuando los datos han sido analizados, el servidor recopila los resultados en archivos de tipo html, es decir, en formato de páginas Web y los muestra a los clientes. Lo anterior permite, reducir la funcionalidad del subsistema cliente a simples labores de entrada-salida que pueden ser desempeñadas por cualquier programa navegador de Web. De esa forma, la arquitectura general del SIAPD puede resumirse en el diagrama mostrado en la figura 15. Figura 15. Arquitectura cliente-servidor empleada 74 Capítulo Seis Desarrollo de Aplicación La arquitectura presentada, es la indicada para soportar las necesidades de cualquier organización encargada del Análisis Delictivo que lleva a cabo la planeación y elaboración descentralizadas de planes preventivos de seguridad pública, producto de la división territorial de cada región de estudio. El servidor empleado para el desarrollo de la aplicación informática puede visualizarse como un cerebro que desarrolla las siguientes actividades tendientes a proporcionar a los clientes diferentes tipos de resultados del análisis y predicción delictiva realizada:       6.2 Mantiene una única copia de la base de datos sobre la que se realiza el análisis. Acceso restringido, mediante claves de acceso, al personal autorizado para ver los datos y realizar análisis sobre ellos. Capacidad de consultar el proceso de Análisis y Predicción Delictiva, desde cualquier ubicación y desde cualquier tipo de computadora. Reducir al mínimo los requerimientos de la(s) computadoras clientes. Contar con la facilidad de tener más de un cliente concurrente, no forzosamente ubicados en el mismo sitio. Capacidad para emitir reportes indexados por Sector de Vigilancia. Base de Datos La información delictiva utilizada durante los procesos de Análisis y Predicción Delictiva es almacenada y administrada mediante una base de datos diseñada bajo el modelo relacional. Esta base de datos se encuentra alojada en el lado del servidor, lo que permite que múltiples usuarios acecen a ella de manera recurrente. Asimismo permite el establecimiento de normas de seguridad que regulan el acceso a ella. 6.2.1. Diseño de la Base de Datos. Para el diseño de la base de datos se empleo el modelo entidad-relación en donde se considera información detallada de aspectos relacionados a la división territorial de la región de estudio, hechos delictivos ocurridos en espacio y tiempo, así como sus características más importantes. En la figura 16 se muestra el modelo entidad-relación empleado. 75 Capítulo Seis Desarrollo de Aplicación Figura 16. Modelo entidad-relación de la aplicación informática desarrollada 6.2.2. Implementación de la Base de Datos. Para la implementación del modelo entidad relación se empleo el manejador MySQL que es un sistema de gestión de base de datos relacional, multihilo y multiusuario. Al contrario de proyectos como Apache, donde el software es desarrollado por una comunidad pública y el copyright del código está en poder del autor individual, MySQL es propietario y está patrocinado por una empresa privada (SUN Microsystems), que posee el copyright de la mayor parte del código. MySQL es muy utilizado en aplicaciones Web, es una base de datos rápida en la lectura, pero en la modificación de datos puede provocar problemas de integridad en entornos de alta concurrencia. En aplicaciones Web hay baja concurrencia en la modificación de datos y un entorno intensivo de lectura de datos, lo que hace a MySQL ideal para este tipo de aplicaciones. 76 Capítulo Seis Desarrollo de Aplicación El manejador de bases de datos MySQL usado fue la versión 5.0 y fue elegido por ser el manejador de software libre más usado, documentado y uno de los más poderosos, además de que el flujo de datos en la aplicación informática propuesta no demanda un manejador más poderoso como Oracle o Informix. 6.3 Módulos de la aplicación La aplicación informática fue desarrollada de manera modular, a fin de que cada uno de los procesos realizados durante el Análisis y Predicción Delictiva cuente con una interfaz propia que administre al módulo de manera independiente, permita la configuración de parámetros por parte de los usuarios y muestre los resultados obtenidos de cada análisis. Cada uno de estos módulos fue implementado como una página web en el lado del servidor utilizando el lenguaje interpretado de programación PHP que es ampliamente usado para este propósito y puede ser incrustado dentro de código HTML. Para el diseño de cada módulo se empleo la herramienta computacional CS3 de DreamWeaver, la cual es una aplicación destinada para la construcción y edición de sitios y aplicaciones basadas en estándares Web. Es uno de los programas de este tipo más utilizados en el sector del diseño y la programación Web, por sus funcionalidades, su integración con otras herramientas como Adobe Flash y, recientemente, por su soporte de los estándares del World Wide Web Consortium. Tiene soporte tanto para edición de imágenes como para animación a través de su integración con otras herramientas. Dreamweaver tiene alta compatibilidad entre la mayoría de los navegadores Web instalados en el ordenador cliente para previsualizar las páginas Web. También dispone de herramientas de administración de sitios dirigidas a principiantes, tales como, la habilidad de encontrar y reemplazar líneas de texto y código por cualquier tipo de parámetro especificado, hasta dentro del sitio Web completo. El panel de comportamientos también permite crear código JavaScript básico sin contar con amplios conocimientos del lenguaje. Un aspecto de alta consideración de Dreamweaver es su arquitectura extensible. Las extensiones, tal y como se conocen, son pequeños programas, que cualquier desarrollador Web puede escribir (normalmente en HTML y Javascript) y que cualquiera puede descargar e instalar, ofreciendo así funcionalidades añadidas a la aplicación. 77 Capítulo Seis Desarrollo de Aplicación Los módulos implementados en la aplicación fueron:    Módulo de inicio de aplicación. Módulo para el Análisis Delictivo. Módulo de predicción delictiva. A continuación se describe de manera detallada cada uno de estos módulos. 6.3.1. Módulo de inicio de aplicación Este módulo tiene como objetivo principal servir de enlace entre los módulos encargados de los diferentes análisis propuestos. Este módulo permite ejecutar la metodología para el Análisis Delictivo. Los parámetros de entrada configurable por el usuario son los siguientes: 1. Modelos de datos. Es posible seleccionar el modelo de datos al que se va a realizar el análisis. Un modelo de datos puede ser considerado como una clasificación de referencia única, cada clasificación de referencia puede contener diferentes familias delictivas y hechos delictivos, el tipo de modelo a seleccionar dependerá del tipo de estrategia policiaca a emplear. 2. Valores de cada uno de los umbrales empleados par la caracterización positiva, negativa y neutra. La figura 17 Muestra una esta página web. 78 Capítulo Seis Desarrollo de Aplicación (2) Umbrales utilizado para la caracterización positiva, negativa y neutra. (1) Permite seleccionar el modelo de datos a emplear en el Análisis Delictivo. Figura 17. Módulo integrador 6.3.2. Módulo para el Análisis Delictivo Este módulo implementa la metodología para el Análisis Delictivo. Dentro de su estructura interna cuenta con una programación hecha mediante PHP que establece una conexión con la base de datos, a fin de extraer información relacionada con los hechos delictivos suscitados dentro de cada uno de los sectores de vigilancia y poner en marcha los algoritmos que permiten determinar todas la propiedades características positivas y negativas de cada familia delictiva, así como aquellas propiedades neutras a todas la familias. Estos procesos se desarrollan de manera interna dentro del módulo y ningún usuario tiene acceso a estos. Sin embargo, el módulo cuenta con una interfaz de usuario que permite la visualización de los resultados que se obtienen del Análisis Delictivo. Esta interface contiene un panel de opciones que permite visualizar las propiedades encontradas del análisis anterior mediante la selección de la familia delictiva, Sector de Vigilancia, mes, tipo de caracterización. En la figura 18 se muestran los parámetros de entrada configurables y los datos de salida del módulo de Análisis Delictivo. 79 Panel de opciones que permite visualizar las propiedades encontradas del Análisis Delictivos, mediante la selección de la familia delictiva, Sector de Vigilancia, mes y tipo de caracterización Detalles específicos de cada propiedad espacio-temporal encontrada. Capítulo Seis Desarrollo de Aplicación Figura 18 Parámetros de entrada y salida del módulo de Análisis Delictivo. 80 Capítulo Seis Desarrollo de Aplicación 6.3.3. Módulo para la predicción delictiva Este módulo implementa la metodología de Predicción Delictiva. Dentro de su estructura interna cuenta con una programación hecha mediante PHP que establece una conexión con la base de datos, a fin de extraer información relacionada con los hechos delictivos suscitados dentro de cada uno de los sectores de vigilancia y así poner en marcha la metodología que permita determinar dentro de un espacio-tiempo seleccionado la cantidad de hecho delictivos se espera que ocurran en una unidad temporal posterior a la contenida en la base de datos de referencia. Estos procesos se desarrollan de manera interna dentro del módulo y ningún usuario tiene acceso a estos. Sin embargo, el módulo cuenta con una interfaz de usuario que permite la configuración de diferentes parámetros de entrada que personaliza la forma en que se realiza la predicción. Los parámetros de entrada configurable por el usuario son los siguientes: 1. Modelos de datos. Es posible seleccionar el modelo de datos al que se va a realizar el análisis. 2. Espacio-Tiempo en donde se realizara la predicción (Sector de vigilancia y mes del año). Los datos de salida que el módulo muestra para cada familia delictiva una vez concluida la predicción son: 3. La cantidad de delitos por cada familia delictiva se predice ocurrirán utilizando probabilidad bayesiana en el espacio-tiempo seleccionado. 4. La cantidad de delitos por cada familia delictiva se predice ocurrirán utilizando la metodología de predicción propuesta en el espacio-tiempo seleccionado. 5. El valor obtenido de cada uno de los análisis involucrados dentro de la predicción delictiva. 6. Número de delitos que ocurrieron de manera real en el espacio tiempo seleccionados. Este valor solo aparece para efectos de evaluar la eficiencia de la metodología de predicción. Sin embrago, esta información no estará disponible una vez implementada la aplicación. 81 Capítulo Seis Desarrollo de Aplicación 7. Octantes horarios característicos de cada familia delictiva en el espacio-tiempo seleccionado. 8. Octantes horarios en donde existen actividades delictivas comunes al espaciotiempo seleccionado. En la figura 19 Se muestran los parámetros de entrada configurables en la interfaz y los datos de salida del módulo de predicción delictiva. Una vez desarrollados los módulos descritos arriba, se configuro en el lado del servidor un servidor de páginas web. Este servidor permite que múltiples usuarios acecen a los módulos de manera recurrente. El servidor de páginas web empleado fue el servidor HTTP Apache de código abierto para plataformas Unix (BSD, GNU/Linux, etc.), Windows, Macintosh y otras, que implementa el protocolo HTTP/1.1 y la noción de sitio virtual. Apache presenta entre otras características altamente configurables, bases de datos de autenticación y negociado de contenido, pero fue criticado por la falta de una interfaz gráfica que ayude en su configuración. Apache tiene amplia aceptación en la red: desde 1996, Apache, es el servidor HTTP más usado. Alcanzó su máxima cuota de mercado en 2005 siendo el servidor empleado en el 70% de los sitios web en el mundo, sin embargo ha sufrido un descenso en su cuota de mercado en los últimos años. (Estadísticas históricas y de uso diario proporcionadas por Netcraf). 82 (1) Permite seleccionar el modelo de datos a emplear para el Análisis Delictivo. (2) Permite seleccionar el espacio-tiempo a predecir. (3) Muestra la Predicción Bayesiana. (4) Muestra la predicción realizada con la metodología de predicción propuesta. (5) Muestra el resultado de cada análisis involucrado en la predicción propuesta. (8) Muestra los octantes horarios en donde existen actividades delictivas comunes al espacio-tiempos seleccionado (7) Muestra los octantes horarios característicos de cada familia delictiva en el espacio-tiempo (6) Muestra la cantidad de delitos ocurridos en el espacio-tiempo seleccionado de manera real Capítulo Seis Desarrollo de Aplicación Figura 19. Parámetros de entrada y salida del módulo de predicción delictiva. 83 Capítulo Seis Desarrollo de Aplicación 6.3.4. Requerimientos de implementación de la aplicación El objetivo de la presente tesis no considera las cuestiones técnicas de implementación de la aplicación informática tales como: Seguridad, número de posibles usuarios recurrentes, red, etc. Sin embargo, plantea las características mínimas que deben tener de los equipos que integran los dos sub-sistemas propuestos en el presente capitulo. Servidor  Conexión a Internet o en su caso una intranet de preferencia de banda ancha.  Un equipo de cómputo con características mínimas para soportar el manejo de Internet:  CPU (Procesador Pentium IV o superior)  Memoria RAM 1 GB  Disco Duro de 250 GB  Puertos USB  Monitor  Teclado  Mouse  Software: Windows Xp en adelante, Office 2003 en adelante. Clientes  Conexión a Internet o en su caso una intranet de preferencia de banda ancha.  Un equipo de cómputo con características mínimas para soportar el manejo de Internet:  CPU Procesador Pentium IV o superior  Memoria RAM 256 MB  Disco Duro de 40 GB  Puertos USB  Mouse  Monitor  Teclado  Software: Windows Xp en adelante, Office 2003 en adelante. 84 CAPÍTULO SIETE Conclusiones y trabajo futuro. Se detallan las conclusiones obtenidas de los resultados observados en la aplicación de la metodología de análisis y predicción delictiva propuesta. 85 Capítulo Siete Conclusiones y trabajo futuro 7.1 Conclusiones. Difícil resulta la tarea de formular conclusiones acerca de una investigación que abarca aspectos que son estudiados desde tan diversos ángulos y perspectivas y que abre tan numerosas rutas para cuestiones de investigación y aplicación. Más aún si se reconoce que los efectos de la investigación en cuestión no resultan evidentes de manera inmediata o siquiera en el corto plazo. Es claro que el impacto de las propuestas presentadas en este trabajo sólo podrá juzgarse con el tiempo, cuando se hayan puesto a prueba en el entorno para el que fueron diseñadas. Cuando ese momento llegue, seguramente habrán todas ellas sido enriquecidas por el trabajo e investigación de diferentes miembros de la comunidad, y muchos de sus conceptos, fundamentos y especificaciones habrán sido revisados, corregidos o simplemente refinados. Por lo pronto, el único curso de acción factible es presentar las diversas reflexiones que surgen del estudio objetivo sobre cada uno de los tópicos abordados en este trabajo. El estudio realizado sobre los patrones delictivos observados en la ciudad de Sacramento, California, en los E.U.A., y su contextualización en el campo del Análisis y Predicción Delictiva, han sido orientados, en todo momento, por el afán de aportar una guía en la toma de decisiones operativas y estratégicas sobre seguridad pública. Resulta claro que los logros de este trabajo no son, ni pretenden ser, suficientes para modificar de forma rápida y drástica la situación delictiva de nuestro país. Sin embargo, también resulta evidente que las propuestas de esta investigación pueden constituirse en importantes aportaciones que abran brecha en el largo camino de volver más eficaces y eficientes a los cuerpos de prevención delictiva. Las metodologías propuestas en este trabajo resultan logros muy modestos al ser comparados con las posibilidades de estudio e investigación que se han abierto. Ahora, para finalizar, se evaluarán las bondades y limitaciones de los conceptos planteados y se resaltarán aquellos aspectos que llaman a estudios más profundos desde nuevas perspectivas, o bien, a cambios sustanciales en la concepción y dinámica cotidiana de las fuerzas de seguridad pública. Con base en lo resultados obtenidos de la experimentación realizada es posible llegar a las siguientes conclusiones acerca de las metodologías propuestas: 1. La metodología para el análisis y predicción delictiva posibilita la formación de una visión global de la situación delictiva. Esta investigación logró aportar una nueva forma de estudiar el comportamiento delictivo, fuera del contexto estadístico, que tradicionalmente se lleva a cabo, empleando para ello, modelos generados en un enfoque de Reconocimiento de Patrones (el enfoque Lógico-Combinatorio) que ha demostrado ser útil en el modelado de diversos problemas de tipo social para los que no se cuenta con una formalización estricta o completa. 86 Capítulo Siete Conclusiones y trabajo futuro 2. Los resultados obtenidos del Análisis Delictivo propuesto permite la determinación de las familias delictivas que están ocurriendo de manera notable (característica y no-característica) en una región de estudio. Asimismo, este análisis identifica las unidades espacio-temporales donde es posible re-asignar recursos humanos y materiales para la atención (prevención o investigación) de las familias delictivas con mayor impacto en la sociedad. 3. Los experimentos realizados entregan resultados de predicción con un error mínimo comparado con los otros métodos de series de tiempo examinados. De igual forma, la metodología ha demostrado ser capaz de realizar predicciones aún cuando la cantidad de hechos delictivos ocurridos, durante un periodo de tiempo, sean escasos. De manera importante, la metodología de predicción propuesta en este trabajo presenta una alta tolerancia a la disminución en el número de datos disponibles para cada predicción, logrando obtener resultados muy cercanos a la realidad con sólo un año de la muestra de supervisión. 4. La metodología para Análisis Delictivo cuenta con una característica muy importante, permite, con base en la construcción de definiciones inductivas positivas, establecer prioridades sobre las actividades delictivas que deberán ser atendidas primero si se desea disminuir los índices delictivos de un Sector de Vigilancia. Esta característica es de suma importancia, ya que la mayoría de los planes de seguridad pública están orientados al nivel de Sector de Vigilancia. Esta jerarquización en las prioridades de atención a familias delictivas no es considerado por la mayoría de las técnicas de análisis delictivo. Estas técnicas analizan cada actividad delictiva de manera independiente, sin considerar otras familias delictivas. Por otra parte, estas técnicas tampoco consideran la división política o administrativa del espacio geográfico estudiado, situación que limita seriamente su capacidad para sugerir la asignación de tareas especificas en materia de seguridad pública a cada jefe de Sector de Vigilancia. 5. La metodología propuesta es original, desarrollada en México y aportan una visión nueva sobre análisis y predicción delictiva. 6. El trabajo conjunto con el sector académico puede cambiar significativamente el proceso de combate y prevención de la delincuencia. 87 Capítulo Siete Conclusiones y trabajo futuro 7.2 Aportaciones A continuación se muestra, en la Tabla 16, las principales modificaciones realizadas a dos algoritmos clásicos de aprendizaje empleados por las familias KORA y Conjuntos Representantes. Tabla 16 Aportaciones realizadas a dos algoritmos clásicos de aprendizaje. Paso Metodología Propuesta Se incluye el concepto de Índice de Ocurrencia. Algoritmo CR Observaciones Este índice permite determinar la proporción de ocurrencia, de cada propiedad, dentro de cada una de las clases en la muestra de supervisión. El Algoritmo CR ocupa un concepto de caracterización estricta, es decir, para que una propiedad sea característica debe ocurrir Caracterización Positiva Dos umbrales 1 1 y  Un solo umbral 1 veces o más en la clase caracterizada y 1 1 veces en todas las demás clases. Por otra parte, la metodología propuesta en este trabajo solo requiere que el Índice de Ocurrencia de la propiedad sea mayor a Para el Algoritmo CR 2 es 1. el número máximo de ocurrencia de la propiedad en una clase y Caracterización Negativa Dos umbrales  2 2 y Dos umbrales 2 2 y  2 es el número mínimo de ocurrencia de la propiedad en las otras clases. En la metodología propuesta 2 es el valor máximo del Índice de Ocurrencia de una propiedad y 2 establece el porcentaje de clases en la muestra, distintas a la que se analiza, en las cuales debe ocurrir la propiedad a fin de ser considerada negativa. es el número Para el Algoritmo CR  mínimo de ocurrencia de la propiedad en todas las clases de la muestra de supervisión. Caracterización Neutra Un umbral  Dos umbrales y 3 3 En la metodología propuesta 3 es el valor mínimo del cociente entre Índice de Ocurrencia de la propiedad y el máximo de dicho índice en todas las clases. 3 es el porcentaje mínimo de clases, en las cuales debe ocurrir la propiedad a fin de ser considerada neutra. Para el caso del Algoritmo KORA-Ω, durante la etapa de aprendizaje encuentra todos aquellos rasgos complejos característicos de cada clase, este paso es similar al que realiza el algoritmo CR durante la construcción de definiciones inductivas positivas. Es por esta razón que las modificaciones presentadas por la metodología propuesta también son 88 Capítulo Siete Conclusiones y trabajo futuro aplicables en la etapa de aprendizaje del algoritmo KORA-Ω, aunque en este algoritmo no existe la construcción de definiciones negativas ni neutras. 7.3 Trabajo futuro El presente proyecto constituye solo un paso inicial dentro de una nueva forma de realizar Análisis y Predicción Delictiva. A pesar de ello, tiene una estructura secuencial que inicia con la determinación de aquellos espacio-tiempos que son afectados por ciertas actividades delictivas de manera notable (característica y no-característica), espacio-tiempos de donde es posible extraer recursos humanos y materiales y, finalmente aquellos espacio-tiempos donde se presentan la mayoría de las familias delictivas. Sin embargo, las recomendaciones de cómo se deben de distribuir los recursos policiacos a fin de reducir el índice delictivo es los espacio-tiempos señalados no es un problema sencillo, es necesario considerar aspectos relacionados con los estados de fuerza policiales, los cuales nos indican la cantidad de recursos de que se disponen (número de policías, armamento, patrullas, etc.) para hacerle frente a la delincuencia. Tomando en cuenta lo anterior, se propone como trabajo futuro lo siguiente:  Desarrollo de una metodología que con base en los resultados obtenidos del Análisis y Predicción Delictiva, haga una asignación optima de los recursos humanos y materiales de que disponga un cuerpo policiaco, con el objetivo de cubrir los espacio-tiempos de mayor incidencia delictiva.  Esta metodología deberá además de considerar aspectos relacionados con la planeación de rutas de vigilancia que permitan que todos los espacio-tiempos determinados en el Análisis Delictivo sean cubiertos por patrullas con el mínimo de recursos y tiempo. 89 Referencias bibliográficas [Arango, 2003] [Arango-Lara, 2006 ] [Arango-Lara, 2008(2)] [ Bishop, 2006 ] [ Bongard, 66 ] [Cheremesina-Shulcloper, 92] [ Clarke-Eck, 2002] [Chatfiel, 00] [Coparmex, 2002 ] [De la vega-Shulcloper, 98] [Devroye-Lugosi, 96] [Dimitriev-ZhuravlevKendrelev, 66] [Duda-Hart, 73] Arturo Arango Durán Información confiable: Los problemas de la información estadística Instituto Nacional de Ciencias Penales, 2003. Arturo Arango Durán y Cristina Lara Medina La Eficiencia del Sistema de Justicia Investigadores del Instituto Ciudadano de Estudios Sobre la Inseguridad A. C. ICESI, 2004. Arturo Arango Durán y Cristina Lara Medina Respuesta Gubernamental Frente al Delito Investigadores del Instituto Ciudadano de Estudios Sobre la Inseguridad A. C. ICESI. Publicado en el libro: Schutte Fernando (Coord), Una propuesta ciudadana en materia de Seguridad Pública, 2006. Christopher M. Bishop Pattern Recognition and Machine Learning Springer, 2006. Bongard M. N. Pattern Recognition Spartan Books, New York-Washington, USA, 1966. Cheremesina N. E., Ruiz Shulcloper J Cuestiones Metodológicas de la Aplicación de Modelos Matemáticos de Reconocimiento de Patrones en Zonas del Conocimiento poco Formalizadas Revista Ciencias Matemáticas, XIII(2), La Habana, CUBA, 1992 Ronald V. Clarke & John E. Eck, 2002. Análisis Delictivo para la Resolución de Problemas en 60 Pequeños Pasos Office of Community Oriented Policing Services, U.S. Department of Justice Traducción al español por: Arturo Arango Durán y Juan Pablo Arango Orozco. Chatfield Chris Time series Forecasting Chapman & Hall/CRC, 2000 Centro de Estudios Económicos del Sector Privado La Inseguridad Pública en México Coparmex, 2002. De la Vega L., Carrasco Ochoa, Riuz-Shulcloper J. Fuzzy Kora-Ω Algorithm. 6th European Congress on Intelligent Techniques and Soft Computing, Pág. 90, 1190-1194. Vol. Vol. 2, 1998. Devroye L., Gyöffi L., Lugosi, G. A Probabilistic Theory of Pattern Recognition Springer-Verlag, New York, USA, 1996. Dimitriev N.A., Y.I. Zhuravlev, F.P. Kendrelev Acerca de los Principios Matemáticos de la Clasificación de Objetos y Fenómenos Sbornik Diskretnii Análisis, 7, Novosibirsk, RUSIA, 1996 Duda O.R., Hart E., Peter, Stork, G. Davis Pattern Classification and Scene Analysis Hohn Wiley and Sons, USA, 1973 90 [Fu, 82] [Fukugama, 72] [Goldfarb, 85] [González-Thomason, 78] [ Gottlieb-Arenberg-Singh, 1994 ] [Haykin, 99] [Hanke, 08] [Haag- Cummings- Phillips, 2000] [I.C.E.S.I.,2008] [Janacek, 2001] [Lind, Marchal, Wathen, 08] [López Reyes, 81] [Manzanera, 1993 ] [Marques de Sá, 01] [Martínez-Trinidad,GuzmánArenas, 01] [ Mena, 2003 ] [Montiel, 1997] [Moreno, Armengol, Béjar, 94] Fu K. S. Syntactic Pattern Recognition and Applications Prentice Hall, Englewood Cliffs, USA, 1972 Fukugama Keinosuke Introduction to Statistical Pattern Recognition Academic Press, Inc. New York, USA, 1972 Goldfarb Lev A New Approach in Pattern Recognition Ed. L. Kanal, A. Rosenfeld. Vol. II, 1985 González C. Rafael, Thomason G. Michael. Syntactic Pattern Recognition: An Introduction Addison-Wesley, 1978 Gottlieb, S.L. Arenberg, S. & Singh, R. Crime Analysis From First Report to Final Arrest. Alpha Publishing, Montclair, CA. USA, 1994. Haykin Simons Neural Networks: A Comprehensive Foundation. Prentice Hall, 1999 Hanke E. John Pronóstico en los negocios Pearson Education, 6/a Edición, 2008 Haag Stephen, Cummings Maeve, Phillips Amy Management Information Systems: For The Information Age. McGraw-Hill, 2000. Instituto Ciudadano de estudios sobre inseguridad pública A.C. Generación de información en seguridad pública. 2008. Janacek Gareth Practical Time Series Arnold Text in Statistics, 2001 Lind Douglas, Marchal William, Wathen Samuel Estadística aplicada a los negocios y a la economía McGrawHill , México, 2008 López-Reyes N. et al. Un Sistema Para el Pronóstico a Corto Plazo de Tormentas Ionosféricas Reporte de invstigación ICIMAF-ACC, 76, La Habana , CUBA, 1981 Rodríguez Manzanera, Luis. Criminología. 8ed. Porrúa, México, 1993. Marques de Sá J.P. Pattern Recognition. Concepts, Methods and application Springer-Verlag, New York, USA, 2001. Martínez Trinidad J.F., Guzmán Arenas A. The Logical Combinatorial Approach to Pattern Recognition, an overview Pattern Recognition, Vol. 34, 2001 Jesús Mena Investigative Data Mining for Security and Criminal Detection Butterworth Heinemann, Elsevier, 2003. Montiel Sosa Criminalística Tomo I Limusa Noriega Editores, México, 1997 Moreno A., Armengol E, Béjar Javier Aprendizaje Automático Ediciones Ups, 1994 91 [ Osborne-Wernicke , 2006 ] [Pons-Shulcloper-Martínez Trinidad, 02] [Ramírez, Chimal, 07] [Ronda, 1996] [Shulcloper-Abidi, 02] [Shulcloper, Guzmán-Arenas, Martínez Trinidad, 99] [Shulcloper-Lazo, 90] [Shulcloper-Sánchez DíazAbidi, 02] [Turban, 1995] [Verde, 1993] Osborne Deborah, Wernicke Susan. Introduction to Criminal Analysis 2ed. Routledge, E.U.A, 2006. Pons- Porrate A., Ruiz Shulcloper J., Martínez Trinidad J. A New Conceptual Clustering Algorithm For Mixed Incomplete data sets Journal of Mathematical and Computer Modeling , 2002 Ramírez-Amaro K., Chimal-Eguía J.C. On a New Approach to to Times Series Tracking. Advance in computer Science and Engineering, eds. Torres S., López I. and Calvo H., Research in Computer Science 27, pp 205-215, México 2007 Carlos C. Ronda Métodos científicos de investigación aplicados al diseño de planes de seguridad Subcomisario de Policía del Neuquén, Argentina, 1996. Ruiz Shulcloper J., Abidi Mongi A. Logical Combinatorial Pattern Recognition: A Review Recent Research Developments in Pattern Recognition, Pub. Transword Research Networks, vol.3 pp 133-176, USA, 2002 Ruiz Shulcloper J., Guzmán-Arenas Adolfo, Martínez-Trinidad J.F. Enfoque Lógico Combinatorio al Reconocimiento de Patrones I: Selección de Variables y Clasificación Supervisada IPN. Colección de Ciencias de la Computación, 1999 Ruiz Shulcloper J., Lazo Cortés Manuel Modelos Matemáticos para el Reconocimiento de Patrones Ed. UCLV, Cuba, 1990 Ruiz Shulcloper J., Sánchez-Díaz G., Abidi M.A. Clustering in Mixed Incomplete Data Heuristic & Optimization for Knowledge, Discovery, Idea Group Publishing USA, 2002 Turban Efaim Decision support and expert systems: management support systems. Englewood Cliffs, N.J., Prentice Hall., 1995 Soria Verde, Miguel Ángel La Víctima: entre la justicia y la delincuencia. Aspectos psicológicos, sociales y jurídicos de la victimización. Promociones y Publicaciones Universitarias, Barcelona, 1993. Páginas de Internet 1. http://www.criminalistica.com.mx/index.php/criminologia 92

Instituto Politécnico Nacional Caracterización y predicción

Documentos relacionados

Productos

Apoyo

Instituto Politécnico Nacional Caracterización y predicción

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib