Revista CENIC Ciencias Biológicas, Vol. 36, No. Especial, 2005 Herramientas del Marketing: Data Warehousing, Tecnologia necesaria para el Comercio Internacional. Rosa Maria Hernández Lamillar FARMACUBA, Vento 4163, Cerro, Ciudad Habana, Cuba. Teléfonos: 577976 al 82, 545365. Fax: 577917 E mail: [email protected], [email protected] RESUMEN: La Empresa Internacional actual y en particular su área de Marketing se ve obligada a realizar cambios e implantar las nuevas tecnologías de la información El objetivo de este trabajo es introducir y analizar aspectos de las nuevas técnicas de la informática y su repercusión en la empresa: Data warehousing, Data warehouse, Data Marts, OLAP, Data Mining, Business Intelligence. La necesidad de obtener información para una amplia variedad de individuos es la principal razón de negocios que conduce al concepto de Data warehouse. El énfasis no está sólo en llevar la información hacia lo alto sino que a través de la organización, para que todos los empleados que la necesiten la tengan a su disposición. Los sistemas de Data warehousing han surgido como respuesta a la problemática de extraer información sintética a partir de datos atómicos almacenados en bases de datos de producción. Uno de los objetivos principales de este tipo de sistemas es servir como base de información para la toma de decisiones. Los beneficios obtenidos por la utilización de este tipo de sistemas se basan en el acceso interactivo e inmediato a información estratégica de un área de negocios. Este acercamiento de la información al usuario final permite una toma de decisiones rápida y basada en datos objetivos obtenidos a partir de las bases de datos (eventualmente heterogéneas) de la empresa. Estos beneficios aumentan cuanto más importantes son las decisiones a tomar y cuanto más crítico es el factor tiempo. El objetivo del Data warehousing será el de satisfacer los requerimientos de información interna de la empresa para una mejor gestión. El contenido de los datos, su organización y estructura son dirigidos a satisfacer las necesidades de información de los analistas. El Data warehouse es el lugar donde la gente puede accesar sus datos. Las aplicaciones de Business Intelligence, donde es obvio que no es posible la sustitución de la intuición y análisis humano, servirán como auxiliares tácticos y estratégicos para empresarios, analistas técnicos y usuarios de información dentro de las empresas. Un proyecto data warehousing se considera exitoso, cuando su objetivo final comienza a concretarse, es decir que el personal use el Data warehousing para satisfacer sus necesidades empresariales. Los cambios que comenzarán a producirse en la empresa al implementar un Data warehousing son variados, es importante entonces anticiparse a estos cambios, considerar sus implicaciones y planificarlos ABSTRACT: The current International Company and in particular their Marketing area is forced to carry out changes and to establish the new technologies of the information The main objective is to introduce and to analyze aspects of the computer science's new techniques and its repercussion in the company: Data warehousing, Data warehouse, Marts, OLAP, Dates Mining, Business Intelligence. The necessity to obtain information for a wide variety of individuals is the main reason of business that leads to the concept of Data warehouse. The emphasis is not only in taking the information toward the high thing but rather through the organization, so that all the employees that need it have at your disposal. The systems of Data warehousing have arisen as answer to the problem of extracting synthetic information starting from atomic data stored in production databases. One of the main objectives of this type of systems is to serve as base of information for the taking of decisions. The benefits obtained by the use of this type of systems are based on the interactive and immediate access to strategic information of an area of business. This approach of the information to the final user one allows taking of quick decisions and based on objective data obtained starting from the databases (possibly heterogeneous) of the company. These benefits increase the more important they are the decisions to take and the more critics is the factor time. The objective of the Data warehousing will be to satisfy the requirements of internal information of the company for a better administration. The content of the data, their organization and structure are directed to satisfy the necessities of the analysts of information. The Data warehouse is the place where people can access her data. The applications of Business Intelligence, where it is obvious that it is not possible the substitution of the intuition and human analysis, they will serve as auxiliary Revista CENIC Ciencias Biológicas, Vol. 36, No. Especial, 2005 tactical and strategic for managers, technical analysts and users of information inside the companies. A project data warehousing is considered successful, when it’s final objective begins to be summed up, that is to say that the personnel uses the Data warehousing to satisfy his managerial necessities. The changes that will begin to take place in the company when It be implementing a Data warehousing. are varied, is important then to be early to these changes, to consider their implications and to plan them. Palabras claves: Data warehousing, Data warehouse, Marketing, Información Key words: Data warehousing, Data warehouse, Marketing, Information INTRODUCCION En la actualidad gran parte de las empresas de comercio exterior cuentan con la automatización de sus procesos, manejando gran cantidad de datos en forma centralizada y manteniendo sus sistemas en línea. En esta información descansa el know−how de la empresa, constituyendo un recurso corporativo primario y parte importante de su patrimonio. Pero no hay duda que de todas las funciones administrativas de una empresa importadora exportadora, la mercadotecnia es la más afectada por las operaciones internacionales y su complejidad se deriva de la necesidad de entender los diversos escenarios que se encuentra al llevar sus productos a los clientes extranjeros. La administración de mercadotecnia internacional tiene que llenar un número de requisitos entre los que encontramos la investigación de mercados internacionales para identificar los diversos clientes finales posibles, clasificarlos usando métodos de segmentación, modificar sus productos de acuerdo a las exigencias del sector, implantar una estrategia internacional de precios para determinar la escala de precios de venta, que ayudarán a la empresa a establecer una ventaja competitiva sostenible en los mercados elegidos, generar una estrategia promocional y organizar un sistema internacional de distribución. Para realizar un análisis de mercado y poder llegar a una decisión, se debe manejar un gran volumen de información, que está en algún lugar de la Red, pero al mismo tiempo, la tarea de encontrar información de calidad y clasificarla puede llevar mucho tiempo y ser casi interminable, al menos para el momento en que es necesaria. En la actualidad se presenta la propuesta de un nuevo paradigma de los sistemas de información en el que se justifica la necesidad de herramientas capaces de satisfacer los requerimientos de este tipo de modelo de datos. Este paradigma de negocio introduce nuevos requerimientos a los sistemas de información, tales como la necesidad de guardar la mayor información posible, la rápida modificación de los modelos organizativos y la necesidad de obtener una información mucho más detallada y variable en cortos períodos de tiempo. En toda organización se emplean tres tipos de información, los datos operativos, los datos operacionales y los datos informativos. Los datos operativos constituyen la gestión de la información del día a día, reflejan los procesos físicos de las organizaciones, como transacciones monetarias, movimientos de mercancías, carga de máquinas, entradas y salidas del personal, etc. Este modelo de datos está integrado por la interrelación de la información necesaria para controlar estos procesos físicos: balances, programación de la producción, nóminas, entre otros. Son datos fuertemente estructurados y permanentes en el tiempo. Estos modelos de datos son los que constituyen los Sistemas de Información Orientados a la Gestión. Los datos operacionales son aquellos necesarios para la toma de decisiones y corresponden a requerimientos de informaciones necesarias para ofrecer una visión de conjunto de la actividad de la organización. Están basados en índices o ratios obtenidos a partir de informaciones homogéneas consolidadas, expuestas de forma comparativa de diversas instancias en el tiempo, tanto pasados, que permiten analizar la evolución de los distintos criterios utilizados, como la proyección de estos datos a instancias futuras. La definición del modelo de datos se hará en función de los ratios o índices que se pretendan controlar, tales como datos históricos, paneles de control, cuadros indicadores, proyecciones de explotación, ventas, compras, etc. Son datos frecuentemente estructurados y variables en el tiempo. Estos modelos de datos son los que constituyen los Sistemas de Información Orientados a la Toma de Decisiones. Y por último los datos informativos, que son los utilizados para la comunicación interpersonal y grupal dentro de la organización, es lo que actualmente se conoce como work-flow o trabajo en grupo, como los procedimientos establecidos para la toma de decisiones, el soporte de la toma de decisiones, el control de los procesos originados por la toma de decisiones y la difusión de la toma de decisiones. Estos datos son débilmente estructurados y variables en el tiempo. Estos modelos de datos son los que constituyen los Sistemas de Información Orientados a la Comunicación. Revista CENIC Ciencias Biológicas, Vol. 36, No. Especial, 2005 Entre estos tres Sistemas de Información existen relaciones. Entre los sistemas de información orientados a la gestión, que manejan los datos operativos, y los orientados a la toma de decisiones, que manejan los datos operacionales, existe en principio una relación que irá del primero al segundo ya que del primero se obtendrán los datos fuente para la elaboración de los datos objeto por el segundo, la relación inversa, en principio no es recomendable, pero no se descarta en ciertos casos. Entre los sistemas de información orientados a la gestión que manejan datos operativos, y los sistemas de gestión orientados a la comunicación, que manejan datos informativos se pueden dar relaciones en los dos sentidos siempre que se transfieran informaciones con datos estructurados. Entre los sistemas de información orientados a la comunicación, que manejan los datos informativos y los sistemas de gestión, orientados a la toma de decisiones, pueden existir relaciones en ambos sentidos, siempre que el tipo de datos a transferir sea analizado para cada caso. En la siguiente figura se muestra el nuevo paradigma informacional de la empresa, tres estructuras de información claramente diferenciadas y relacionadas. INFORMACION OPERACIONAL (Para la toma de INFORMACION DE GRUPO (Flujo de trabajo) INFORMACION OPERATIVA (El dia a dia) Los datos operativos son los generados y manipulados en los procesos de negocio y constituyen el “día a día” de la empresa. En cambio los datos operacionales son los manipulados por la Dirección para tomar las decisiones empresariales para su gestión competitiva. En realidad esto los convierte en el “panel de a bordo” de la empresa o su “sistema de gobierno” y, como tal, fundamentalmente, estos datos sólo son extractivos. Así queda reflejado en la flecha unidireccional que los relaciona. Por tanto, los datos operacionales son sólo informativos y no tienen funciones de actualización sobre los datos operativos. El tercer tipo de datos soporta los flujos de trabajo en la empresa para su distribución y utilización por el grupo y corporación, se nutren tanto de los datos operativos como de los datos operacionales y ejercen una función de control (flecha discontinua) sobre los mismos. Las Tecnologías de la Información han cambiado sustancialmente la forma de trabajo de las empresas. Los negocios en general y el marketing en particular, será un proceso intensivo de información en este milenio. Deberá centralizarse en desarrollar estrategias de explotación de la información, para responder de forma individual a los consumidores. Los sistemas de Data warehousing son el centro de la arquitectura de los sistemas de información contemporáneos. La necesidad de obtener información para una amplia variedad de individuos es la principal razón de negocios que conduce al concepto de Data warehouse. Data warehouse o Almacén de Datos es un sistema que ofrece acceso fácil y rápido a información vital para la gestión y operación de una empresa, que permite acceso a datos históricos y detallados. Es un sistema donde la información es alimentada por múltiples sistemas fuentes. Es un sistema de análisis de información destinado a todo tipo de usuario. El Data warehouse se construye y actúa sobre los datos operacionales. Al ser los datos operacionales sólo informativos y no tener funciones de actualización sobre los datos operativos, permite sacar las máximas ventajas de rendimiento, tanto con el acceso a los datos, como con el SGBD (Sistema de Gestión de Base de datos) base para el Data warehouse. Data warehousing o Almacenamiento de Datos es el proceso que facilita la creación y explotación de un Data warehouse. Es un proceso complejo, que hace real la Gestión del Conocimiento. Para conseguirlo será necesaria la aplicación de una metodología y la implantación de una arquitectura tecnológica de la gestión del conocimiento. Data warehousing es un metaproceso compuesto por un conjunto de procesos. Por citar los más conocidos, formarían parte de este proceso la creación del Data warehouse, su explotación analítica mediante técnicas de OLAP (On−line analytical processing) o técnicas de Data Mining El concepto Data Mart es una extensión natural del Data warehouse y está enfocado a un departamento o área especifica, como por ejemplo los departamentos de Finanzas o Marketing, permitiendo así un mejor control de la información que se está abarcando. Revista CENIC Ciencias Biológicas, Vol. 36, No. Especial, 2005 Data Mining (minería de datos) es una máquina virtual y lógica que trasforma los datos en información útil para alcanzar los objetivos del negocio. Comprende predicciones, modelos, simulaciones dinámicas, reglas lógicas y árboles de decisión. El conjunto ordenado de todo ello puede constituir lo que llamamos el Conocimiento Corporativo. OLAP (On Line Analytical Processing o Procesamiento Analítico en línea) son sistemas de soporte a la decisión usando tecnologías de Data warehouse. En general, estos sistemas OLAP deben soportar requerimientos complejos de análisis, analizar datos desde diferentes perspectivas y soportar análisis complejos contra un volumen ingente de datos. La funcionalidad de estos sistemas se caracteriza por ser un análisis multidimensional de datos corporativos, que soportan los análisis del usuario y posibilidades de navegación, seleccionando la información a obtener. En definitiva, el proceso de Data warehousing debe orientarse a proveer la información correcta, a la persona indicada, en el formato adecuado y en el tiempo preciso. Alrededor de este repositorio de datos se ubican las funciones que permiten el procesamiento analítico de la información, convirtiéndola en Conocimiento Útil. Así como el proceso de Data Mining se plantea como un proyecto y se avanza por saltos/incrementos de mejora, el proceso de construcción de un Data Warehouse se basa en una actividad continua de creación y mejora del Data Marts; ya que los Data warehouse no son más que modelos de datos con fines característicos. Por esto se pueden enumerar las siguientes etapas de definición del Data Warehouse Etapa 0: ¿Qué datos poseemos? Auditoria previa de la empresa. Este inventario se cargará en el Diccionario de Datos Etapa 1: ¿Qué datos queremos obtener? Vistas de negocio que se facilitarán a los usuarios finales del Data Mart Etapa 2: Definición del acceso a los datos. Solucionar los problemas de información distribuida, en soportes heterogéneos y definir la temporalización del acceso Etapa 3: Definición de las transformaciones. Aquí se detallan los filtros, fusiones, consolidaciones, agregaciones y otras técnicas de manipulación de datos que transportan desde los datos operativos a los datos operacionales Etapa 4: Definición de la Distribución. Define los perfiles de usuario y la asignación al Data Mart Etapa 5: Definición recursos de almacenamiento. Correcta selección y planificación del hardware, software y red a emplear Etapa 6: Definición de los metadatos. Definir la estructura del diccionario de datos. La carga de los datos se realiza durante todo el proceso de creación del Data Warehouse Etapa 7: Desarrollo visualizaciones predefinidas. Diseñar presentaciones de los datos predefinidas para que los usuarios las utilicen “enlatadas” Etapa 8: Plan y seguimiento de explotación. Definición del plan y seguimiento de explotación, se rellena/detalla una arquitectura/modelo de referencia del Data Warehouse CONCLUSIONES El marketing por ser el proceso mediante el cual la organización se adapta al entorno, será la disciplina que enfrentará responsabilidades sobre elementos importantes de la estrategia informacional del negocio. Un proyecto Data warehousing se considera exitoso, cuando su objetivo final comienza a concretarse, es decir que el personal lo use para satisfacer sus necesidades empresariales. Los cambios que comenzarán a producirse al implementar un Datawarehosing son variados, es importante entonces anticiparse a estos cambios, considerar sus implicaciones y planificarlos en la empresa. Se observaran las siguientes situaciones: El personal de la empresa depende del Data warehouse como un recurso primario de información, tornándose menos dependiente de los sistemas operacionales y de sus bases de datos para sus necesidades de información. Se ve reducida o eliminada la demanda por programación especializada para encontrar la información necesaria Los usuarios y uso del Data warehouse crecen, con un correspondiente incremento en la demanda de soporte La complejidad de cambios en los sistemas operacionales se incrementa, y su efecto sobre el Data warehouse debe ser considerado Revista CENIC Ciencias Biológicas, Vol. 36, No. Especial, 2005 BIBLIOGRAFIA 1. BusinessObjects Data integrator. htpp://spain.businessobjects.com/productos/data_ integrator.htm, 12-112004+ 2. BusinessObjects Rapid Marts. htpp://spain.businessobjects.com/productos/rapid_ marts.htm, 12-11-2004 3. Business intelligence. htpp://www.cipher.com.ve/business%intelligen.htm, 12-11-2004 4. Business Intelligense for Excel. http://www.bixl.com, 13-11-2004 5. Business intelligence. http://www.nscon.com, 13-11-2004 6. Business Intelligense. Una introducción a OLAP y Business Data Marts. Alejandro Bauvin, htpp://www.axxonconsulting.com/uploads/business%20intelligence.pdf, 13-11-2004. 7. Business intelligence: La necesidad actual .Roberto C.Navarrete, http://www.gestiopolis.com/, 12-11-2004 8. Conocimientos-La divisa del Nuevo milenio. http://www.conocimientosweb.net/portal/dic10.html, 11-11-2004 9. Data Mining.. Anónimo, htpp://www.monografias.com.trabajos/datamining/datamining.shtml, 12-11-2004 10. Express OLAP Access Pack. htpp://spain.businessobjects.com/productos/oracle_express.htm, 12-11-2004 11. El Data Mining en las estrategias B2C del e-business. Dr.Alfonso Garcia Marcos, Conferencia, Lisboa, mayo 2000, htpp://www.systembit.es/B2CDAT.htm, 12-11-2004 12. Introducción al Análisis de Datos. www.emagister.com, 12-11-2004 13. Integración de datos. htpp://spain.businessobjects.com/productos/data_ integracion.htm, 12-11-2004 14. Jointcube. htpp://www.asesorum.net/repository/jincube.pdef, 12-11-2004 15. La tecnología Data warehousing. htpp://pdf//rincondelvago.com/data warehousing, 11-11-2004 16. La tecnología Data warehousing. Carmen Gloria Wolf, http://www.inf.udec.cl/revista/edicion3/cwolff.htm, 12-11-2004 17. La esencia de los negocios internacionales. James Taggart &Michael C. McDermott 18. Medición de la demanda de mercado. Curso on line, htpp://www.emagister.com, 12-11-2004 19. OLAP. Anónimo, Universidad Peruana de Ciencias Aplicadas, www.emagister.com, 12-11-2004 20. OLAP, ROLAP, MOLAP. htpp://www.csi.map.es/csi/silice/DW2251.html, 13-11-2004 21. Servicios OLAP. http://www.microsort.com/spansh/MSDN/estudiantes/ssii/admin/olap.asp, 1admin.2004, 1211-204 22. Sistemas OLAP. http://www.error500.net/garbagecollector/archives/categorias/bases_de_datos/ sistemas_olap, 13-11-2004. 23. Sistema de información de marketing. Dr Elena Font, Fac. Economía, UH, marzo, 2004 24. WebStudio e-OLAP. htpp://www.deister.es/deisterwww/es/products/web-studio/wmd/e-olap.htm, 2004. 12-11-