Subido por Alexis lopez

ANALISIS-proyecto parte 2

Anuncio
UNIVERSIDAD VALLE DEL GRIJALVA
CAMPUS COMITAN
MATERIA: DATAMINING Y DATAEWAREHOUSE
DOCENTE: ING. JOSE LUIS RAMOS GONZALEZ
ACTIVIDAD: TÉCNICAS DE MINERÍA DE DATOS PARA EL
DESCUBRIMIENTO DE PATRONES.
LICENCIATURA: INGENIERIA EN SISTEMAS COMPUTACIONALES
ALUMNO: ALEXIS ADRELI LOPEZ VAZQUEZ
GRUPO: 9
FECHA DE ENTREGA: 26 DE JUNIO DE 2020
Introducción:
La realización de base de datos se ha vuelto una acción fundamental para las empresas,
ya que les permiten crear estrategias para conseguir nuevos clientes o fidelizar a los
habituales. Pero a consecuencia de la generación masiva de datos, nos encontramos frente a
un problema, la infoxicación, disponemos de tanta información, que a veces es imposible
organizarla con efectividad. Por ello, la clave está en descubrir patrones o algoritmos para
sacarle el máximo partido, y aquí es donde entra en juego el Data Mining o minería de
datos.
Se dice que la minería de datos es el proceso de hallar anomalías, patrones y
correlaciones en grandes conjuntos de datos para predecir resultados el Data Mining es un
conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera
automática o semiautomática, con el objetivo de encontrar patrones repetitivos que
expliquen el comportamiento de estos datos.
Desarrollo:
La minería de datos o exploración de datos es un campo de la estadística y las ciencias
de la computación referida al proceso que intenta descubrir patrones en grandes volúmenes
de conjuntos de datos. Utiliza los métodos de la inteligencia artificial, aprendizaje
automático, estadística y sistemas de bases de datos. Su objetivo del proceso de minería de
datos consiste en extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso.
El proceso de minería de datos comprende varios pasos como crear, probar y trabajar
con los modelos de minería. El proyecto de minería de datos comienza con un plan bien
definido de inteligencia comercial. Los analistas de la empresa definen el problema a
resolver y el objetivo concreto de empresa que se desea cumplir. Cuanto mejor sea esta
formulación inicial, más claras serán las direcciones acerca de los datos y las funciones de
minería que se utilizan para conseguir los resultados deseados. Un proceso, se entiende
como el conjunto de etapas sucesivas, típico de minería de datos consta de los siguientes
pasos generales:
1.- Selección del conjunto de datos, tanto en lo que se refiere a las variables de objeto,
como a las variables independientes, como posiblemente al muestreo de
los registros disponibles.
2.- Análisis de las propiedades de los datos, en especial los histogramas, diagramas
de dispersión, presencia de valores atípicos y ausencia de datos.
3.- Transformación del conjunto de datos de entrada, se realizará de diversas formas en
función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería
de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce
como preprocesamiento de los datos.
4.- Selección y aplicación de la técnica de minería de datos, se construye el modelo
predictivo, de clasificación o segmentación.
5.- Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un
modelo de conocimiento, que representa patrones de comportamiento observados en los
valores de las variables del problema o relaciones de asociación entre dichas variables.
6.- Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a
su validación comprobando que las conclusiones que arroja son válidas y suficientemente
satisfactorias.
Para crear una minería de datos estas son las fases principales siguientes:
1.- Selección y preparación de datos.
2.- Creación del modelo de minería de datos (también denominada fase de preparación).
3.- Un modelo de minería de datos se crea a partir de un conjunto específico de datos de
entrada.
4.- Durante el proceso de creación del modelo, una vez preparados los datos, debe
Especificar sus decisiones sobre:
1.- Dónde residen los datos de entrada
2.- Qué campos de los datos de entrada son apropiados
3.- Qué valores se deben utilizar para la función de minería determinada que está
utilizando
4.- Dónde desea almacenar el modelo final
5.- Se utiliza los siguientes objetos de base de datos para crear un modelo:
6.- Métodos definidos por el usuario
7.- Procedimientos almacenados
8.- Funciones definidas por el usuario
9.- Prueba de un modelo y análisis de su calidad.
10.- Se puede probar un modelo de Clasificación o Regresión. Después, se puede
analizar la calidad del modelo.
Utilización de un modelo que ofrece información acerca de:
1.- La visualización de los resultados.
2.- Puede visualizar los resultados de la minería de datos para analizarlos e
interpretarlos.
3.- Puntuación de los registros de datos.
4.- Los modelos se aplican a otros datos en la fase de aplicación de la minería de datos.
5.- Análisis de un modelo y preparación para otros pasos del proceso.
6.- Puede utilizar varias funciones para recuperar información acerca del modelo
contenido en las tablas a fin de que otros programas de aplicación realicen otros procesos.
Conclusión:
En conclusión, podemos decir que el procedimiento de minería de datos es recopilar la
información necesaria para llegar al resultado deseado, considerando la comprensión del
problema o la necesidad que se quiere resolver.
En si es un conjunto de técnicas y tecnologías que permiten explorar grandes bases de
datos, de manera automática, con el objetivo de encontrar patrones repetitivos que
expliquen el comportamiento de estos datos. La minería de datos tiene la intención o el
objetivo de ayudar a comprender una enorme cantidad de datos, y que estos, puedan ser
utilizados para extraer conclusiones para contribuir en la mejora y crecimiento de las
necesidades de la información.
Descargar