UNIVERSIDAD VALLE DEL GRIJALVA CAMPUS COMITAN MATERIA: DATAMINING Y DATAEWAREHOUSE DOCENTE: ING. JOSE LUIS RAMOS GONZALEZ ACTIVIDAD: TÉCNICAS DE MINERÍA DE DATOS PARA EL DESCUBRIMIENTO DE PATRONES. LICENCIATURA: INGENIERIA EN SISTEMAS COMPUTACIONALES ALUMNO: ALEXIS ADRELI LOPEZ VAZQUEZ GRUPO: 9 FECHA DE ENTREGA: 26 DE JUNIO DE 2020 Introducción: La realización de base de datos se ha vuelto una acción fundamental para las empresas, ya que les permiten crear estrategias para conseguir nuevos clientes o fidelizar a los habituales. Pero a consecuencia de la generación masiva de datos, nos encontramos frente a un problema, la infoxicación, disponemos de tanta información, que a veces es imposible organizarla con efectividad. Por ello, la clave está en descubrir patrones o algoritmos para sacarle el máximo partido, y aquí es donde entra en juego el Data Mining o minería de datos. Se dice que la minería de datos es el proceso de hallar anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados el Data Mining es un conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos que expliquen el comportamiento de estos datos. Desarrollo: La minería de datos o exploración de datos es un campo de la estadística y las ciencias de la computación referida al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. Su objetivo del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso. El proceso de minería de datos comprende varios pasos como crear, probar y trabajar con los modelos de minería. El proyecto de minería de datos comienza con un plan bien definido de inteligencia comercial. Los analistas de la empresa definen el problema a resolver y el objetivo concreto de empresa que se desea cumplir. Cuanto mejor sea esta formulación inicial, más claras serán las direcciones acerca de los datos y las funciones de minería que se utilizan para conseguir los resultados deseados. Un proceso, se entiende como el conjunto de etapas sucesivas, típico de minería de datos consta de los siguientes pasos generales: 1.- Selección del conjunto de datos, tanto en lo que se refiere a las variables de objeto, como a las variables independientes, como posiblemente al muestreo de los registros disponibles. 2.- Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos. 3.- Transformación del conjunto de datos de entrada, se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos. 4.- Selección y aplicación de la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación. 5.- Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. 6.- Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. Para crear una minería de datos estas son las fases principales siguientes: 1.- Selección y preparación de datos. 2.- Creación del modelo de minería de datos (también denominada fase de preparación). 3.- Un modelo de minería de datos se crea a partir de un conjunto específico de datos de entrada. 4.- Durante el proceso de creación del modelo, una vez preparados los datos, debe Especificar sus decisiones sobre: 1.- Dónde residen los datos de entrada 2.- Qué campos de los datos de entrada son apropiados 3.- Qué valores se deben utilizar para la función de minería determinada que está utilizando 4.- Dónde desea almacenar el modelo final 5.- Se utiliza los siguientes objetos de base de datos para crear un modelo: 6.- Métodos definidos por el usuario 7.- Procedimientos almacenados 8.- Funciones definidas por el usuario 9.- Prueba de un modelo y análisis de su calidad. 10.- Se puede probar un modelo de Clasificación o Regresión. Después, se puede analizar la calidad del modelo. Utilización de un modelo que ofrece información acerca de: 1.- La visualización de los resultados. 2.- Puede visualizar los resultados de la minería de datos para analizarlos e interpretarlos. 3.- Puntuación de los registros de datos. 4.- Los modelos se aplican a otros datos en la fase de aplicación de la minería de datos. 5.- Análisis de un modelo y preparación para otros pasos del proceso. 6.- Puede utilizar varias funciones para recuperar información acerca del modelo contenido en las tablas a fin de que otros programas de aplicación realicen otros procesos. Conclusión: En conclusión, podemos decir que el procedimiento de minería de datos es recopilar la información necesaria para llegar al resultado deseado, considerando la comprensión del problema o la necesidad que se quiere resolver. En si es un conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática, con el objetivo de encontrar patrones repetitivos que expliquen el comportamiento de estos datos. La minería de datos tiene la intención o el objetivo de ayudar a comprender una enorme cantidad de datos, y que estos, puedan ser utilizados para extraer conclusiones para contribuir en la mejora y crecimiento de las necesidades de la información.