IBM Software Business Analytics IBM ® SPSS ® Statistics Identifique fácilmente a sus mejores clientes Utilice el software de análisis predictivo de IBM SPSS para obtener información a partir de su base de datos de clientes Introducción Contents 1 Introducción 2 Exploración de los datos de clientes 3 ¿Dónde viven sus clientes? 4 ¿ Cuál es la media de ingresos familiares de sus clientes? 4 ¿ Cuánto tiempo llevan sus clientes siendo clientes suyos? 5 D etección de grupos de clientes con el análisis de actividades recientes, frecuencia y valor monetario (RFM) 7 ¿ Cómo responden los clientes a las diferentes ofertas promocionales? 8 ¿ Varía la retención de clientes según el área? 10 ¿ Ha variado la respuesta de los clientes a la oferta 1 según el área? 12 ¿Cuánto han gastado los clientes? 12 ¿Cuánto gastarán los clientes? 16 P uesta en marcha de las acciones correspondientes 17 Conclusión 17 Acerca de IBM Business Analytics “¿Quiénes son nuestros mejores clientes? ¿Aquellos que es más probable que respondan a nuestras ofertas?” Si se encarga de las ventas, de marketing o del servicio de atención al cliente, querrá una respuesta a estas preguntas. De hecho, le conviene conocer mejor a todos sus clientes, tanto los mejores como los peores. El motivo es que la planificación e implementación de estrategias eficaces y rentables para cada segmento de clientes es esencial para aumentar los beneficios comerciales. Este documento se centra en el modo en que una empresa puede identificar a sus mejores clientes o a los más valiosos, pero los mismos procesos pueden utilizarse para otros segmentos de clientes. El conocimiento acerca de sus mejores clientes (sus actitudes, patrones de compra y perfiles demográficos) es la clave para desarrollar e implementar programas de marketing y gestión de relaciones con los clientes que tengan éxito. Dicho conocimiento le ayuda a enfocar de manera eficaz sus campañas promocionales, de publicidad y de marketing, así como a desarrollar programas de ventas cruzadas y de productos de categoría superior y de fidelidad, retención y recompensas para los clientes a largo plazo. La coordinación de estos esfuerzos es especialmente importante a medida que el marketing se va alejando de un producto para masas y se acerca a un mensaje más personalizado, enfatizando la presentación de productos o servicios determinados para tipos específicos de clientes. La información fiable y detallada sobre el comportamiento de los clientes, sus actitudes y otras características constituye una ventaja sobre la competencia y ayuda a mejorar el retorno de la inversión en todas sus interacciones con los clientes. La información obtenida incluso del análisis más elemental de las características de los clientes puede tener profundas implicaciones para su negocio. SPSS ha sido una de las pioneras en el campo del análisis de datos; sus aplicaciones de software fueron unas de las primeras en su sector y siguen siendo de las más populares y más utilizadas. Como nuevo miembro de la organización IBM SPSS puede ofrecer sus productos y soluciones de análisis vanguardistas a un mayor número de organizaciones de todo el mundo. IBM Software Business Analytics Funciones destacadas: El conocimiento acerca de sus mejores clientes (sus actitudes, patrones de compra y perfiles demográficos) es la clave para desarrollar e implementar programas de marketing y gestión de relaciones con los clientes que tengan éxito. El software de análisis de IBM SPSS puede ayudarle a obtener información fiable y detallada acerca del comportamiento de los clientes para mejorar su ventaja sobre la competencia. IBM SPSS Statistics La oferta de IBM SPSS incluye productos líderes del sector de la minería de datos y texto, recopilación de datos, gestión y software estadístico para identificar a sus mejores clientes y planificar programas de marketing más eficaces y rentables. Las herramientas de IBM SPSS se basan en estándares del sector y pueden integrarse fácilmente con su infraestructura existente para mejorar la precisión, recurrir a menos personal y reducir las pérdidas al mínimo. La combinación de los esfuerzos de IBM y SPSS le ofrece lo último en flexibilidad en cuanto a los tipos de datos a los que aplica la minería y al modo de distribuir los resultados. Este documento técnico muestra cómo se puede analizar una base de datos de clientes mediante el software de análisis predictivo de IBM SPSS. Esta familia integrada de productos para el análisis estadístico y la gestión de datos le acompaña a través del proceso analítico, independientemente de si realiza el análisis desde un único equipo de sobremesa o a través de una red extensa. Los datos de marketing que utilizaremos para los ejemplos de este documento abarcan a 2.070 clientes e incluyen la siguiente información: • • • • • • • Fecha en la que el cliente se convirtió por primera vez en cliente nuestro Historial de compra según el valor en dólares de los pedidos Respuesta a las diferentes ofertas Información de abandono o rotación de clientes Nivel de ingresos familiares Clasificación geográfica Sexo y otras variables demográficas Nuestro objetivo es identificar los segmentos o grupos de clientes exclusivos donde se encuentran los mejores clientes de nuestra empresa. Asimismo, explicaremos cómo utilizar el software de IBM SPSS para obtener información a partir de los datos de sus clientes, predecir su comportamiento futuro y tomar mejores decisiones comerciales. Exploración de los datos de clientes Empezaremos examinando las diferentes variables de nuestra base de datos para responder, entre otras, a las siguientes preguntas: • • • • ¿Dónde viven sus clientes? ¿Cuál es la media de ingresos familiares? ¿Cuánto tiempo llevan sus clientes siendo clientes suyos? ¿Cuánto dinero gastan sus clientes en sus productos y servicios? El software de IBM SPSS ofrece varios métodos para obtener respuestas a estas preguntas rápidamente. Los procedimientos Frecuencias y Descriptivos de IBM® SPSS® Statistics son de gran utilidad para echar un primer vistazo a sus datos. A menudo, este ejercicio puede sugerir los mejores métodos para analizar sus datos. * IBM SPSS Statistics se denominaba anteriormente PASW® Statistics. 2 IBM Software Business Analytics IBM SPSS Statistics ¿Dónde viven sus clientes? IBM SPSS Statistics puede ayudarle a determinar si sus clientes viven en un área urbana, suburbana o rural, así como a seleccionar las estrategias de marketing correctas. Identificar dónde viven sus clientes (en un área urbana, suburbana o rural) puede ayudarle a determinar la mejor estrategia de marketing que despierte su interés. El procedimiento Frecuencias de IBM SPSS Statistics proporciona una tabla de recuentos y porcentajes por categoría, junto con una representación visual de los datos en un gráfico de barras, histograma o gráfico de sectores, que incluye etiquetas de las categorías asignadas a cada valor. A partir de los resultados que se muestran en el gráfico 1, descubrimos que la mayor proporción de la base de clientes vive en un área suburbana (34,2%) y la menor proporción vive en un área rural (19,4%). También vemos que el 16,9% se muestra como datos ausentes, que son los casos en los que no se proporcionó ninguna información sobre el domicilio. Gráfico 1: Las áreas donde viven sus clientes. Suele ser de utilidad saber dónde y por qué hay información ausente en sus datos. IBM SPSS Statistics considera datos ausentes tanto un valor totalmente nulo como un valor residual, como por ejemplo “no aplicable” o “NS/NC”. Esto permite que los analistas distingan entre los datos ausentes porque la pregunta u observación no es aplicable para el encuestado y los que lo son porque no se dio ninguna respuesta. La tabla 1 de la página siguiente muestra los resultados de una distribución de frecuencia. Los valores que aparecen en la columna de porcentaje se han calculado utilizando todos los casos del conjunto de datos (N = 2.070). La columna de porcentaje válido muestra la distribución proporcional de los casos que sólo tienen datos válidos o que no tienen datos ausentes (N = 1.720). Esto permite una rápida comparación de las distribuciones al estar una al lado de otra; una gran diferencia entre estas dos columnas puede sugerir un sesgo en los datos. La tabla 1 también muestra que falta casi el 17% de los datos, lo que indica que es posible que haya problemas en los análisis. 3 IBM Software Business Analytics IBM SPSS Statistics IBM SPSS Statistics le permite distinguir fácilmente si falta información o si un valor es nulo. Tabla 1: La tabla revela que la mayoría de los clientes (el 41,1%) vive en el área suburbana. ¿Cuál es la media de ingresos familiares de sus clientes? Hay varias formas de lograr una imagen más detallada de sus clientes. Por ejemplo, para obtener información acerca de los ingresos familiares utilizamos estadísticos de resumen básicos, como la media, los valores mínimo y máximo y la desviación típica. El procedimiento Descriptivos de IBM SPSS Statistics le permite echar un primer vistazo y obtener información de sus datos de nivel de escala o intervalo, como los ingresos (cuantificados en dólares). La tabla 2 que aparece a continuación muestra los resúmenes descriptivos de los ingresos familiares. Tabla 2: El procedimiento Descriptivos de IBM SPSS Statistics ofrece un breve resumen que indica que la media de ingresos familiares es de 61.386,39 $. Vemos en la tabla 2 que la media anual de ingresos familiares de los casi 2.000 clientes que nos comunicaron sus ingresos es de 61.386,39 $. Al observar la desviación típica de aproximadamente 11.000 $, sabemos que la mayoría de los clientes (aproximadamente el 68%) gana entre 50.000 $ y 72.000 $. Las funciones de estadísticos descriptivos de IBM SPSS Statistics le permiten obtener información detallada acerca de los ingresos familiares de sus clientes. ¿Cuánto tiempo llevan sus clientes siendo clientes suyos? Para determinar el tiempo de permanencia de sus clientes, obtenga un nuevo campo en los datos utilizando la fecha en la que el cliente entró por primera vez en la base de datos. Al restársela a la fecha actual o a la fecha de su transacción más reciente, puede determinar cuánto tiempo lleva un cliente siendo cliente suyo. Si utiliza una de las múltiples funciones temporales disponibles en IBM SPSS Statistics, podrá transformar los datos fácilmente en el número de años que lleva con ese cliente. En la base de datos también aparece información de abandono, o el estado del cliente como actual o que ha abandonado. Con esta información y el tiempo que lleva el cliente en la base de datos, puede determinar la “supervivencia” de clientes o el tiempo que un cliente mantiene su fidelidad antes de abandonar. 4 IBM Software Business Analytics IBM SPSS Statistics puede determinar su tasa de abandono y cuánto tiempo llevan sus clientes siendo clientes suyos, lo que puede ayudarle a identificar tendencias y a actuar de manera proactiva para conservar a sus clientes. IBM SPSS Statistics El análisis de supervivencia de Kaplan-Meier es un modo especialmente útil de cuantificar el tiempo que transcurre hasta que un cliente pasa a estar inactivo o deja de ser cliente suyo. Una ventaja importante del análisis de supervivencia de Kaplan-Meier es que este método tiene en cuenta la pérdida de clientes en la base de datos antes de que se pueda determinar el abandono: por ejemplo, si un cliente sigue siendo “actual” pero está inactivo desde hace un tiempo. En el gráfico 2 que se muestra a continuación podemos ver que a medida que aumenta el tiempo dentro de la base de datos, hay menos clientes que permanezcan activos. Dicho de otro modo, la proporción acumulada de clientes que permanecen en la base de datos disminuye de manera constante a medida que aumenta el tiempo. Observamos que la mediana del tiempo de supervivencia (o el momento en el que el 50% de los clientes ha abandonado) es de aproximadamente 11 años. Gráfico 2: El gráfico de supervivencia de Kaplan-Meier de IBM SPSS Statistics indica que la mediana del tiempo de supervivencia como cliente es de 11 años.* Detección de grupos de clientes con el análisis de actividades recientes, frecuencia y valor monetario (RFM) A continuación, puede determinar quiénes son sus mejores clientes. Estos suelen definirse como los clientes más rentables o aquellos que gastan más dinero en su organización. Para obtener la imagen más precisa del valor del ciclo de vida de clientes, confiamos en el análisis de actividades recientes, frecuencia y valor monetario (RFM). Por ejemplo, podemos clasificar a los clientes según: • • • • Aquellos que hayan gastado más (con mayor frecuencia y más recientemente). Aquellos que hayan gastado más (un importe superior pero sin realizar compras desde hace mucho tiempo). Aquellos que hayan gastado más en el menor número de transacciones. Aquellos que hayan gastado menos, o con menor frecuencia, y que no hayan realizado compras desde hace mucho tiempo. Gracias a esta función, puede determinar cuáles son sus mejores clientes dependiendo de si han comprado recientemente, de la frecuencia de sus compras y de la cantidad que han gastado. * El análisis de Kaplan-Meier que aparece arriba mostró que el valor de la mediana de permanencia en la base de datos de clientes es de 11 años y que el valor medio (no mostrado) es de 9,974 años. No obstante, recuerde que una ventaja importante de la curva de Kaplan-Meier es que el método puede tener en cuenta datos “censurados”: pérdidas en la muestra antes de poder observar el resultado final (por ejemplo, si un cliente se elimina de los datos antes de poder determinar el abandono). 5 IBM Software Business Analytics El análisis de RFM de IBM SPSS Statistics le permite identificar a sus “mejores clientes”: aquellos que gastan más dinero en su organización. Asimismo, le permite centrarse en ese grupo de forma eficaz y específica. IBM SPSS Statistics Si utiliza el análisis de RFM de IBM SPSS Statistics, podrá generar una lista de los clientes que hayan gastado más indicando las variables adecuadas, las identificaciones de cliente, las fechas de las transacciones y el importe de las transacciones. En este caso, es necesario tener una identificación de cliente asociada a cada transacción. La fecha de la transacción es importante para saber cuándo o con qué frecuencia compra el cliente. Por último, como querrá saber cuánto ha comprado un cliente durante su ciclo de vida, también debe incluir el total. Figura 1: El análisis de RFM le permite indicar rápidamente las variables necesarias. Una vez haya introducido estas variables, podrá ejecutar el análisis para obtener las puntuaciones de RFM de sus clientes y determinar en qué clientes quiere centrarse. En este caso, podría centrarse en los clientes con una puntuación de RFM de 555, que significa que han comprado recientemente, lo hacen con frecuencia y gastan más dinero. Una vez obtenido los resultados, podrá ordenar los datos para centrarse en sus principales clientes con una puntuación de RFM de 555. Figura 2: El análisis muestra puntuaciones de RFM. 6 IBM Software Business Analytics IBM SPSS Statistics Al utilizar otros análisis descriptivos del gasto de los clientes, verá que la mayoría de los clientes gasta 500 $ o menos y que, en niveles superiores del valor en dólares, el número de clientes que realiza compras disminuye de manera constante. La media de la cantidad que gastan los clientes es de 1.360 $ y sólo un número muy pequeño de clientes gasta más de 7.000 $. De momento, por lo que sabemos, un cliente estándar: • • • • Vive en un área suburbana. Tiene unos ingresos familiares de 61.000 $. Gasta 1.360 $ en nuestros productos y servicios. Tiene una mediana de supervivencia o “ciclo de vida” de 11 años. ¿Cómo responden los clientes a las diferentes ofertas promocionales? El análisis de IBM SPSS Statistics de los resultados de promociones de marketing específicas es un paso importante para comprender a sus clientes. La evaluación de los esfuerzos pasados ayuda a identificar qué ha funcionado y qué no, para que así pueda duplicar sus logros y aprender de sus errores. Aquí queremos responder a dos preguntas: • • ¿Cuántas personas han respondido a cada una de nuestras cuatro ofertas? ¿Cuál es la media de la cantidad gastada como respuesta a nuestras diferentes promociones? Para ello, ejecutaremos el procedimiento Frecuencias en la respuesta de cada oferta y el procedimiento Descriptivos en el valor de los pedidos de las cuatro ofertas. En la tabla 4, vemos que 890 clientes (el 44,5% de la base de datos de clientes) respondieron a la oferta 1. El mismo análisis de las otras ofertas muestra una respuesta del 39% a la oferta 2, del 37,4% a la oferta 3 y del 17,4% a la oferta 4. Figura 3: Mediante el análisis de RFM, puede determinar qué cliente ha gastado más durante un periodo específico. 7 IBM Software Business Analytics IBM SPSS Statistics Sabemos que la oferta 1 tiene la tasa de respuesta más elevada, pero no qué cantidad de ingresos han supuesto dichas respuestas para la empresa. Al ejecutar el procedimiento Descriptivos en las ofertas de la 1 a la 4, conocemos que el valor de la oferta 1, 376,64 $, es también el mejor de las cuatro ofertas, como se muestra en la tabla 4; por el contrario, la oferta 3, que también tuvo una tasa de respuesta muy elevada, es la peor con 293,98 $ por respuesta. Por lo tanto, la oferta 1 es la mejor según ambos procedimientos. Tabla 4: Casi el 45% u 890 de las personas de la base de datos de clientes respondieron a la oferta 1. ¿Varía la retención de clientes según el área? Para dar respuesta a esta pregunta, generamos un potente gráfico estadístico: el diagrama de caja. Éste muestra tanto el valor de la mediana como la distribución de los datos. En el diagrama de caja del gráfico 3, observamos que los clientes de áreas rurales tienen un mayor valor de mediana en la permanencia en la base de datos, lo que sugiere que llevan siendo clientes más tiempo, de media, que los de otras áreas. Gráfico 3: El diagrama de caja muestra tanto la mediana como la distribución de los datos. Resulta sencillo observar que los clientes de áreas rurales tienen un valor de mediana superior en cuanto a la duración, lo que sugiere que llevan siendo clientes más tiempo, de media, que los de otras áreas. 8 IBM Software Business Analytics El análisis de IBM SPSS Statistics de los resultados de campañas de marketing específicas le ayudará a aumentar su éxito y a aprender de sus errores. IBM SPSS Statistics Una comparación de medias proporciona estadísticos de resumen para un valor de medición por grupo. La tabla 5 complementa la información que aparece en el diagrama de caja en un formato de tabla. Revela que aunque la permanencia media total en la base de datos es de 7,49 años, los clientes de áreas rurales han seguido siendo clientes más tiempo que los de áreas suburbanas o urbanas. Tabla 5: El análisis del historial de compra revela que el valor de la oferta 3, 293,98 $, es inferior al valor medio de las otras ofertas. ¿Es esto significativo? La significación estadística nos indica si las diferencias que vemos en nuestros datos han podido producirse por accidente o no, o bien si es probable que dichas diferencias reflejen patrones en una población más amplia y justifiquen una mayor atención. El informe ANOVA de la tabla 6 muestra que las diferencias entre áreas en cuanto a permanencia de clientes son estadísticamente significativas. Se suele considerar que algo es estadísticamente significativo cuando la probabilidad de que esto ocurra por accidente es menor del 5% (menos de 5 veces de 100). Esto se indica con el nivel de significación 0,05 o menor. Como el nivel de significación indicado en esta tabla es 0,000, muy por debajo del umbral de 0,05, llegamos a la conclusión de que no es probable que la diferencia en las medias que observamos en los datos se produjera por accidente. La distribución total de la media de retención de clientes y el área probablemente no se deba a causas aleatorias, sino a otros motivos. Tabla 6: Este informe de comparación de medias muestra que aunque la permanencia media total en la base de datos es de 7,49 años, los clientes de áreas rurales han seguido siendo clientes más tiempo, de media, que los de áreas suburbanas o urbanas. Algunos de los ejemplos de los posibles motivos son los siguientes: • • • La primera oficina se abrió en un área rural. Hay mayor demanda del producto en un área que en otra. La introducción de determinada función de un producto tuvo más éxito en un área específica. Puede que existan otros motivos que deban someterse a investigación. Es por eso que también es importante conocer su negocio para recopilar los datos adecuados y comprobar sus teorías acerca de las relaciones. 9 IBM Software Business Analytics IBM SPSS Statistics ofrece potentes funciones de gráficos estadísticos para visualizar los datos de retención de clientes por región. IBM SPSS Statistics ¿Ha variado la respuesta de los clientes a la oferta 1 según el área? A continuación, seguimos con nuestro análisis de respuesta a la oferta. IBM SPSS Statistics proporciona un modo sencillo de presentar gráficamente información sobre las cuatro ofertas mediante un gráfico de barras agrupadas. El gráfico 4 proporciona un resumen de los patrones de respuesta por área. Observamos que los clientes de áreas urbanas tienden a realizar menos pedidos de la cuenta en comparación con los de las otras dos áreas, especialmente la rural. Ésta es una conclusión a la que no podríamos haber llegado viendo únicamente la distribución de frecuencia de área, que muestra que las áreas rurales tienen menos personas. Gráfico 4: El gráfico de barras agrupadas de IBM SPSS Statistics ofrece un modo rápido y claro de presentar patrones de respuesta por área. Para determinar si esto es significativo, podemos examinar más detenidamente los resultados de las ofertas individuales por área. Para responder a la pregunta “¿Cómo ha respondido la gente de cada área a la oferta 1?”, realizamos una tabla de contingencia de IBM SPSS Statistics de la oferta 1 por área. La tabla 7 muestra que el 41,3% de las personas que respondieron a la oferta 1 pertenecían a áreas suburbanas. Y aunque sólo el 26,5% de las personas que respondieron a la oferta 1 eran de áreas rurales, estas personas suponían más de la mitad (el 50,5%) de los clientes rurales. Tabla 7: El informe ANOVA muestra que las diferencias que observamos son estadísticamente significativas, lo que justificaría un examen más detallado. Para comprender si el área está asociada con la respuesta a la oferta 1, comparamos los porcentajes de las filas de porcentaje de área y descubrimos que el 45% de las personas de áreas suburbanas y el 40% de las personas de áreas urbanas respondió a esta oferta. Basándonos en esta información, llegamos a la conclusión de que las áreas rurales son idóneas para una oferta como la oferta 1. 10 IBM Software Business Analytics IBM SPSS Statistics Tabla 8: Aunque sólo el 26,5% de las personas que respondieron a la oferta 1 eran de áreas rurales, estas personas suponían más de la mitad (el 50,5%) de los clientes rurales. Sin embargo, aunque parezca que los porcentajes son diferentes, éste no es motivo suficiente para empezar a duplicar la oferta 1 en áreas rurales. Primero debemos determinar si el área y la respuesta a la oferta 1 son independientes entre sí. Aquí el estadístico de chi-cuadrado resulta de utilidad para determinar si las distribuciones observadas en los datos reflejan patrones en una población más amplia. La tabla 9 contiene información de chi-cuadrado para el área y la oferta 1. En este caso, el chi-cuadrado es significativo (p = 0,007) e indica que no es probable que los patrones de la tabla se produjeran por accidente. Podría haber un motivo específico e identificable que lograra que la oferta 1 tuviera más éxito en áreas rurales. Quizás la redacción del texto supo cubrir mejor sus necesidades, o bien el tipo de medio utilizado fue el más adecuado para captar su atención. Tabla 9: Un chi-cuadrado de 0,007 para el área y la oferta 1 indica que las diferencias entre áreas son significativas. Identificando lo que hizo que la campaña tuviera éxito en áreas rurales, podremos aprovechar dicho conocimiento en ofertas futuras para esa área. También puede que decidamos explorar otras relaciones relativas a dicha área. 11 IBM Software Business Analytics IBM SPSS Statistics ¿Cuánto han gastado los clientes? IBM SPSS Statistics ofrece un modo sencillo de presentar gráficamente los resultados de varias ofertas simultáneamente. De nuevo, mediante el análisis de RFM, podemos indicar las variables para determinar lo que queremos saber. En este caso, deseamos saber qué clientes han gastado más dinero. Una vez ejecutemos el análisis, podremos ordenar los resultados por el valor en dólares de las transacciones totales. Otro modo de consultar el historial de compra es evaluar la cantidad total gastada, en lugar del dinero gastado en pedidos individuales. Quizás una relación entre el dinero total gastado y el área revele alguna información. Un análisis ANOVA unidireccional proporciona información específica sobre la significación de las diferencias en los valores medios que puede que vea. Lo primero que proporciona un análisis ANOVA unidireccional es una tabla de estadísticos descriptivos. La tabla 9 muestra que la media de la cantidad total gastada en respuesta a cada una de las cuatro ofertas varía enormemente según el área. En áreas urbanas, la media de la cantidad gastada fue de 1.206,01 $; en áreas suburbanas, fue de 1.391,70 $; mientras que en áreas rurales, fue de 1.618,27 $. El informe también muestra que la media de la diferencia que se muestra entre los niveles de gasto de las áreas suburbanas y rurales no es estadísticamente significativo. Por otro lado, muestra que la diferencia entre las áreas rurales y urbanas sí es significativa. Puede utilizar esta información para examinar más detenidamente de qué modo y por qué estas áreas son diferentes y desarrollar planes de marketing personalizados para sacar el máximo partido a las diferencias. Por ejemplo, una mezcla de marketing y ventas diferente, una oferta distinta o un conjunto especial de productos y servicios puede funcionar mejor en las áreas urbanas. Los programas de marketing de áreas rurales deberían repetirse en esos lugares para seguir teniendo éxito. ¿Cuánto gastarán los clientes? Los modelos predictivos son potentes herramientas que ayudan a centrarse en los clientes potenciales y aprovechar al máximo los recursos de marketing. Ayudan a responder preguntas como “¿Cuánto gastarán los clientes, según su nivel de ingresos?”. En muchos estudios estadísticos, el objetivo es establecer una relación, expresada como una ecuación, para predecir los valores típicos de una variable basándose en el valor de otra. IBM SPSS Statistics ofrece varios procedimientos para establecer relaciones y definir modelos predictivos. Estos procedimientos incluyen diagramas de dispersión y correlaciones, análisis de regresión logística y lineal y árboles de clasificación. Con las instrucciones por pasos y las funciones de ayuda incorporadas en la familia de productos IBM SPSS Statistics, puede realizar estos procedimientos con éxito, aunque no sea estadista. 12 IBM Software Business Analytics IBM SPSS Statistics Mediante el análisis de actividades recientes, frecuencia y valor monetario (RFM) de IBM SPSS Statistics, puede analizar los dólares totales gastados así como la información de pedidos individuales para informar acerca de ofertas especiales y planes de marketing específicos. El gráfico 5 muestra la forma de las relaciones entre estas dos variables. El diagrama de dispersión es el gráfico correcto para mostrar la distribución conjunta de dos variables continuas o de intervalos. El coeficiente de correlación 0,608, que se muestra en la tabla 10, indica una relación sólida y positiva entre los ingresos familiares y el dinero total gastado. El análisis de regresión define más detalladamente la relación con un modelo, como se muestra en la tabla 11. Esta relación indica que a medida que aumentan los ingresos familiares, el dinero total gastado en productos aumenta proporcionalmente. Se trata de información valiosa que, si se combina con más información acerca de sus clientes, puede utilizarse para predecir cuánto es probable que gaste cada cliente. Gráfico 5: El diagrama de dispersión muestra la forma de las relaciones entre estas dos variables. Cuanto más ganan los clientes, más gastan en nuestros productos. Con IBM® SPSS® Decision Trees, podemos identificar segmentos exclusivos dentro de nuestra base de datos, basados en la probabilidad de cada cliente de tener una característica o comportamiento específico que nos interese predecir. Esto se muestra en el gráfico 6 que aparece a continuación: Gráfico 6: IBM SPSS Decision Trees presenta un modelo que muestra que es más probable que los clientes con determinadas combinaciones de características respondan a la oferta 1. 13 IBM Software Business Analytics IBM SPSS Statistics Tabla 10: La media de la cantidad gastada por los clientes en respuesta a nuestras cuatro ofertas fue de 1.378,69 $, pero este valor varía según la región. Tabla 11: Un coeficiente de correlación de 0,608 indica una correlación sólida y positiva entre los ingresos y los pedidos, lo que indica que a medida que aumentan los ingresos familiares, la cantidad total gastada en nuestros productos se incrementa proporcionalmente. Para comenzar el análisis, introducimos información acerca del área, la categoría de clase de producto y los ingresos familiares en un modelo para determinar qué clientes tienen más probabilidades de responder a la oferta 1. IBM SPSS Decision Trees puede utilizar uno de los cuatro algoritmos de crecimiento de árbol establecidos para crear un diagrama de árbol con los resultados, como se muestra en el gráfico 6. Se observa que los ingresos son el mayor predictor, lo que se corresponde con las conclusiones de regresión anteriores. Si sólo se tienen en cuenta los ingresos familiares, el grupo de clientes con ingresos de entre 57.743 $ y 64.893 $, con una tasa de respuesta del 53,9%, no parece ser un objetivo tan bueno como el grupo con mayores ingresos. Pero IBM SPSS Decision Trees puede ir más allá de la simple regresión lineal para examinar más interacciones entre características de clientes al permitir que las interacciones entre predictores se definan a sí mismas, derivándose directamente de los datos en lugar de que el analista deba definirlas. 14 IBM Software Business Analytics IBM SPSS Statistics Cuando los detalles del siguiente nivel de ramas también se utilizan para comparar segmentos, observamos que las familias con ingresos de entre 57.743 $ y 64.893 $ que también adquirieron elementos de la clase de producto “AB” (nodo 8 de los gráficos 6 y 7) tienen un 21,8% más de posibilidades de responder a la oferta 1 que las familias del nodo 10, que tienen mayores ingresos familiares pero que adquirieron elementos de las clases de producto “C2” y “DE”. Gráfico 7: La vista detallada de un nodo del árbol de clasificación muestra que el 73% de los clientes con ingresos de entre 57.743 $ y 64.893 $ que adquirieron productos de la clase “AB” probablemente responda a la oferta 1. IBM SPSS Decision Trees nos ofrece una imagen mucho más clara de los subsegmentos y del conjunto de criterios que realmente definen a nuestros “mejores clientes” en comparación con los tipos de análisis anteriores. Podremos utilizar esta vista más detallada para pronosticar las ventas con mayor precisión y mejorar nuestros esfuerzos de marketing. Tabla 12: Una regresión lineal define la relación entre los ingresos familiares y la cantidad gastada por los clientes. 15 IBM Software Business Analytics Los modelos predictivos son potentes herramientas que le ayudan a responder preguntas del tipo “cuánto gastarán los clientes según sus ingresos”. IBM SPSS Statistics Puesta en marcha de las acciones correspondientes A través de los análisis descritos aquí, IBM SPSS Statistics nos ha permitido analizar rápidamente nuestros datos para conocer algunos aspectos importantes sobre nuestros clientes habituales. Hemos descubierto que los clientes de áreas suburbanas tienden a serlo a más largo plazo. También es más probable que tengan ingresos superiores a la media. Asimismo, no han respondido bien a la oferta 3 en general. Además, al utilizar potentes técnicas de segmentación y de modelado predictivo para identificar relaciones, hemos desarrollado un modelo que describe la relación entre los ingresos y el dinero total gastado que ayuda a predecir las ventas futuras. También hemos identificado segmentos de clientes exclusivos por su probabilidad de respuesta a la oferta 1. Al comparar múltiples características y grupos, IBM SPSS Statistics nos ha ayudado a aprender algo más sobre los patrones subyacentes. La oferta 3 no sólo era la menos lucrativa para nosotros; era especialmente poco productiva en áreas urbanas, que tendieron a responder con menor entusiasmo a nuestras ofertas en comparación con las otras dos áreas. El hecho de que los clientes de áreas urbanas tuvieran la media de ingresos más baja ayuda a explicar su respuesta relativamente baja a nuestras ofertas. Al identificar estos grupos de clientes, podemos enfocar mejor los programas de marketing y de retención de clientes. Por ejemplo, como las familias con ingresos superiores muestran un mayor potencial de ingresos, podríamos ofrecerles productos y servicios adicionales o desarrollar programas de retención de clientes que sirvan para mantenerlos como clientes satisfechos a largo plazo. También podemos detectar que, aunque los clientes de áreas urbanas en general no respondieron bien a nuestras ofertas, las mujeres de un nivel de ingresos específico de dichas áreas sí lo hicieron, lo que sugiere que tal vez sea conveniente centrarnos en ellas en cierto tipo de campaña. Como resultado de los análisis realizados, podríamos establecer los planes siguientes: • • • • • Crear un nuevo programa de retención de clientes para nuestros mejores clientes, los que se definen como clientes a largo plazo con ingresos superiores de áreas suburbanas que adquirieron elementos de la clase de producto “AB” Desarrollar y comprobar un nuevo conjunto de productos y servicios para cubrir mejor las necesidades de los clientes y clientes potenciales de áreas urbanas con menores ingresos. Repetir el desarrollo de ventas del área rural en las áreas urbanas y suburbanas para conseguir clientes a largo plazo. Duplicar la oferta 1 para clientes potenciales en áreas rurales. Lograr que los fondos de futuras campañas de marketing coincidan con la rentabilidad pronosticada de los segmentos (basada inicialmente en los ingresos familiares). 16 IBM Software Business Analytics IBM SPSS Statistics Conclusión Este documento describe tan sólo varias de las formas en las que puede utilizar el análisis predictivo para comprender mejor a sus clientes. Al observar a sus clientes desde diversas perspectivas, podrá planificar programas más eficaces y cuantificar los resultados de modo más sistemático. Así, establecerá relaciones más sólidas con los clientes que valora más y reducirá los costes que empleaba en atender a los segmentos de clientes de menor valor. Otros productos de IBM SPSS le permiten anticipar los cambios en las preferencias y comportamientos de sus clientes. Las soluciones de análisis predictivo le permiten planificar de manera proactiva sus estrategias comerciales y ofrecen una potente ventaja sobre la competencia en cualquier sector. Sin embargo, en este documento hemos mostrado que la familia de productos IBM SPSS Statistics ofrece una amplia gama de opciones analíticas, disponibles en un único conjunto de productos integrados. Aunque no sea estadista, podrá aplicar esta información al mercado con mayor eficacia, conservar a sus clientes más valiosos e incrementar la rentabilidad de su negocio. Acerca de IBM Business Analytics El software IBM Business Analytics ofrece información completa, coherente y precisa en la que los órganos de toma de decisiones confían para mejorar el rendimiento comercial. Un conjunto integral de inteligencia empresarial, análisis avanzado, rendimiento comercial y gestión de estrategias, así como de aplicaciones de análisis predictivo le ofrece una perspectiva clara, inmediata e interactiva del rendimiento actual y la capacidad para predecir resultados futuros. Como parte de este portafolio, el software de IBM SPSS Predictive Analytics ayuda a las organizaciones a predecir eventos futuros y actuar proactivamente según esa información para llegar a mejores resultados de negocio. Clientes del entorno comercial, gubernamental y académico de todo el mundo confían en la tecnología de IBM SPSS como una ventaja competitiva para atraer, retener y aumentar los beneficios con sus clientes, a la vez que reducen el fraude y mitigan los riesgos. Al incorporar el software de IBM SPSS en sus operaciones diarias, las organizaciones se convierten en empresas predictivas – capaces de direccionar y automatizar decisiones para cumplir con los objetivos de negocio y conseguir una ventaja competitiva apreciable. Para más información, visite www.ibm.com/spss/es. 17 © Copyright IBM Corporation 2010 IBM Corporation Route 100 Somers, NY 10589 Derechos restringidos de usuarios del Gobierno de EE.UU. - El uso o duplicación de revelación está restringido por el GSA ADP Schedule Contract con IBM Corp. Creado en Estados Unidos de América Mayo de 2010 Reservados todos los derechos IBM y el logotipo de IBM, ibm.com, WebSphere, InfoSphere y Cognos son marcas comerciales de International Business Machines Corporation en EE.UU., otros países o ambos. Si estos u otros términos con marca comercial de IBM están indicados en su primera aparición en esta información con un símbolo de marca comercial (® o TM), dichos símbolos indican una marca comercial registrada en EE.UU. propiedad de IBM en el momento de la publicación de esta información. Dichas marcas comerciales también pueden estar registradas en otros países. Existe una lista actualizada de marcas comerciales de IBM bajo “Copyright and trademark information” en www.ibm.com/legal/copytrade.shtml. SPSS es una marca comercial de SPSS, Inc., an IBM Company, registrada en muchas jurisdicciones de todo el mundo. Otros nombres de empresas, productos y servicios pueden ser marcas comerciales o marcas de servicio de terceros. Por Favor Recicle Business Analytics software IMW14294ESES-01