Separar la mena de la ganga · ELPAÍS.com 1 de 2 http://www.elpais.com/articulo/dinero/inversiones/Separar/mena/ganga... registrar Negocios Inicio Internacional España Deportes Economía Bolsas | Fondos | DOCUMENTO conectar Martes, 29/9/2009, 17:09 h Tecnología Cultura Gente y TV Sociedad Opinión Blogs Participa Negocios Consulta el auto del juez Pedreira con la lista de los 71 imputados por el Tribunal Superior de Madrid ELPAIS.com > Economía > Negocios ANÁLISIS: Carreras & capital humano QUÉ ES... Minería de datos Separar la mena de la ganga GUSTAVO PINTADO 14/06/2009 Vota Resultado 1 votos Para definir conceptos se puede usar la forma positiva (qué es) o la negativa (qué no es). Para el caso de la Minería de Datos usaremos ambas, ya que frecuentemente se usa este término para cosas que poco o nada tienen que ver con lo que es la Minería de Datos. Una definición muy extendida es: "Extracción no trivial de información potencialmente útil, implícita en los datos y previamente webs en español desconocida". La Minería de Datos es la ciencia en otros idiomas que se encarga a partir de grandes repositorios de información de obtener la que es útil de forma automática sin un conocimiento previo de qué se va a obtener. Se trata de descubrir relaciones entre las variables, patrones de comportamiento e identificación de los grupos de comportamiento y sus diferencias. La noticia en otros webs La información obtenida se puede usar para crear modelos de predicción, clasificación o segmentación. Proporciona herramientas para la toma de decisiones o la automatización de procesos complejos como la detección en tiempo real de transacciones electrónicas fraudulentas o de averías o fallos de construcción. Visto qué es Minería de Datos, veamos ejemplos de lo que muchas veces se presenta como tal y no lo es, sobre todo porque no implica un "descubrimiento" de información desconocida, sino que se trata de una organización más clara de los datos conocidos: -Procedimientos para cálculo predefinido de indicadores que resumen datos de bases de datos. Llavero Mini Altavoz Precio 14.95 € Lo más visto ...valorado ...enviado 1. Alonso cobrará 25 millones de euros al año en Ferrari 2. Fernando Trueba, a por su segundo Oscar con 'El baile de la Victoria' 3. Una firma sospechosa de financiar al PP de Camps pagó a la red Gürtel en Madrid 4. Los presupuestos de 2010 recogen más gasto y menos inversión 5. Muere una niña británica tras recibir la vacuna contra el virus del papiloma -Implementaciones de repositorios como son los Data-Warehouses y Data-Marts que resumen información recopilada por las bases de datos operacionales. 6. Los Reyes y Zapatero, mañana en Copenhague -Sistemas de visualización de datos o indicadores calculados a partir de los mismos siguiendo relaciones previamente conocidas. 8. Nadie quiere dirigir el instituto 7. La Casa del Rey congela su presupuesto por primera vez en la historia 9. Boris Becker, solidario y cervecero 10. Intel busca desterrar el USB con fibra óptica La implementación real de técnicas de Minería de Datos implica el conocimiento profundo de conceptos y metodologías propias de la Inteligencia Artificial, siendo éste uno de los mayores escollos para implementar estas técnicas en los repositorios. Un proceso típico de Minería de Datos consta de los siguientes pasos generales: Listado completo 1. Selección del conjunto de datos, referida tanto a las variables dependientes como a las variables objetivo. 2. Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos). 3. Transformación del conjunto de datos de entrada en función del análisis previo, con el objetivo de prepararlo para aplicar la mejor técnica de Minería de Datos. 4. Seleccionar y aplicar la técnica de Minería de Datos. Se construye el modelo predictivo, de clasificación o segmentación. 5. Evaluar resultados contrastándolos con una serie de datos reservada para validar el modelo. 29/09/2009 17:08 Separar la mena de la ganga · ELPAÍS.com 2 de 2 http://www.elpais.com/articulo/dinero/inversiones/Separar/mena/ganga... Si el modelo no supera la evaluación el proceso se podría repetir en su totalidad o desde uno de los pasos. Una vez validado, si resulta ser aceptable (proporciona salidas adecuadas y/o con márgenes de error admisibles), éste ya está listo para su explotación. Los modelos obtenidos se aplican incorporándolos en los sistemas de análisis de información de las organizaciones, e incluso, en los sistemas transaccionales. Gustavo Pintado es socio director de Gamco. Vota Resultado Imprimir Estadística Corregir Derechos 1 votos Compartir: Enviar Puedes utilizar el teclado: ¿Qué es esto? Texto Si te ha interesado esta información, te recomendamos: Otras ediciones Publicado en Edición Impresa en la sección de Negocios Versión texto accesible Edición de Bolsillo, edición para PDA/PSP ó Móvil Edición Impresa en PDF - 14-06-2009 Última hora Lo último Vídeos Agencia EFE Fotos Gráficos El Olympique aterriza en Madrid con Morientes y Heinze - 16:05 16:55 México: La administración del miedo 16:51 Las lluvias torrenciales anegan La Plana 16:42 El catalán es la octava lengua más activa en los blogs 16:38 Premios Casa de las Ciencias El PP asegura que el gasto público aumenta un 8'6% en los presupuestos para 2010 - 15:58 16:37 Un grupo de senadores checos presenta un recurso contra el Tratado de Lisboa Ver más noticias Salgado, sobre los Presupuestos: "No tengo la impresión de que a los grupos de izquierda les resulte difícil aprobarlos" - 15:22 Otros vídeos Ayuda Contacto Venta de fotos Publicidad Aviso legal elpais.com en tu web SiteIndex © EDICIONES EL PAÍS, S.L. - Miguel Yuste 40 - 28037 Madrid (España) Canal de la Sociedad de la Información 29/09/2009 17:08