• No se han encontrado resultados

Caso de estudio de bebidas isotónicas: powerade

N/A
N/A
Protected

Academic year: 2020

Share "Caso de estudio de bebidas isotónicas: powerade"

Copied!
19
0
0

Texto completo

(1)

Caso de Estudio: Powerade

Coca Cola FEMSA es la embotelladora más grande de la marca Coca-Cola a nivel mundial, al atender 2.9 millones de puntos de venta y comercializar 3.2 billones de cajas por año1Ingresa al mercado

colombiano en el 2003, año en el que adquiere el 100% del sistema Coca-Cola de América Latina. La compañía maneja bebidas carbonatadas como no carbonatadas bajo varias marcas, tales como. Coca-Cola, Fanta, Sprite, Fresca, Ciel, Café Black, Fuze Tea y Powerade. Con la marca Powerade se embotellan exclusivamente bebidas isotónicas que buscan rehidratar y reponer minerales perdidos en la actividad física. Según consultas a representantes de la empresa, las principales bebidas que le compiten en el país se encuentran Gatorade (84,7% del mercado), Squash (0,1%) y Sporade (3,3%); En este mercado Powerade ocupa el segundo lugar con (12%).

FEMSA Colombia ha concluido que el mercado de bebidas isotónicas no está completamente atendido y considera que existe la oportunidad de aumentar su pool de consumidores del 12% al 21%2. Con el objetivo de alcanzar la meta del 21%, el presente estudio se orienta a identificar a los

clientes a los que Coca-Cola FEMSA debe ofrecer sus bebidas isotónicas para así capturar el mercado desatendido de Bogotá, que representa el 16% de ventas de bebidas isotónicas del país.

En el marco del objetivo mencionado este estudio busca encontrar los factores que explican el éxito de un cliente de bebidas isotónicas a fin de identificar otros clientes que teniendo características similares, no alcanzan el mismo nivel de ventas. Es importante señalar que no se busca identificar dónde abrir nuevos puntos de venta exitosos.

Los clientes de FEMSA Colombia para bebidas isotónicas cubren un gran número de canales, cerca de 27, que involucran desde grandes superficies como súper-mercados hasta pequeños comercializadores como porterías. Sin embargo, a partir del análisis histórico de ventas y de la opinión experta de los representantes de la compañía, se acordó que el estudio se debería centrar en cuatro canales: i) Licorerías/Cigarrerías, ii) Mini-mercados, iii) Tiendas de Barrio y iv) Panaderías. Con base en los datos suministrados por Coca-Cola FEMSA se puede afirmar que la distribución de las transacciones por canal no es uniforme. Es así que en 2014 los tres (3) mejores canales participan con más del 50% donde los supermercados presentan la mayor participación, seguidos de las Tiendas de Barrio y los Mini-mercados. Es de tener en cuenta que en este caso de estudio no se incluyeron los supermercados por solicitud de FEMSA Colombia 2 (Ver Figura 1).

1 Según la Página oficial de FEMSA: http://www.femsa.com/es

(2)

Figura 1. Distribución de Transacciones por Canal (2014)

De otra parte, Coca-Cola FEMSA no puede determinar si el nivel de transacciones de un determinado cliente se explica en características tales como cercanía a sitios de interés o si estas no se están aprovechando para lograr mayores transacciones de Powerade. Igualmente la Firma no cuenta con herramientas para determinar el éxito de un cliente para bebidas isotónicas pues no ha realizado los análisis correspondientes. Esto significa que una de las dificultades a atender se presenta como problema “no supervisado”.

Otro de las complicaciones que enfrenta el análisis se relaciona con el número de clientes de FEMSA Coca-Cola en Bogotá, que son alrededor de 165’000, cada uno de los cuales cuenta con más de 12 características intrínsecas.

Finalmente también se presenta el problema de la distribución no uniforme en la ciudad de los 19’338 clientes, pertenecientes a los cuatro (4) canales estudiados durante el año 2015. (Ver Figura 2).

(3)

Figura 2. Clientes del 2015 de los canales: Mini-mercados, Panaderías, Tiendas de Barrio y Licorerías/ Cigarrerías

Ante la situación anteriormente descrita y teniendo en cuenta que el objetivo de Coca-Cola FEMSA es aumentar el porcentaje de participación en el mercado de bebidas isotónicas a través de la captura del mercado desatendido, la pregunta que se debe resolver es: ¿A cuáles clientes de la ciudad de Bogotá, pertenecientes a los cuatro (4) canales escogidos, se le debe ofrecer Powerade?

Análisis Exploratorios

Para resolver la pregunta de Coca-Cola FMSA se ha realizado el siguiente análisis respecto al comportamiento de las transacciones de Powerade y las características de los clientes:

Con base en el registro de ventas realizado entre el primer trimestre de 2012 y el segundo trimestre de 2015 se observa una tendencia creciente en las ventas de bebidas isotónicas siendo el más importante el verificado en el segundo trimestre del 2015. Además de la clara tendencia creciente, se verifica que actos como la promoción de Powerade durante la Copa América de futbol3 mejoran el nivel de ventas de manera significativa. (Ver Figura 3)

3 Según datos suministrados por la firma

(4)

Figura 3. Registro de Ventas. Desempeño Trimestral (2012-2015)

Un análisis sobre la estratificación del mercado realizado para el 2014 muestra que si bien la mayoría de ventas se realizan a clientes de estrato III, con una diferencia de más de mil unidades transadas con respecto a los otros estratos, en promedio, el estrato V tiene el mejor comportamiento al superar en 3 transacciones al segundo mejor estrato que es el IV. (Ver Figura 4)

Figura 4. Promedio de Transacciones por Estrato (2014)

Según la clasificación de la firma en clientes oro, plata y bronce establecida según la demanda de productos Coca-Cola, de los datos obtenidos resulta que en promedio el mayor número de transacciones corresponde a los clientes plata (Ver Figura 5). Esto quiere decir que los clientes que más piden productos Coca-Cola, en promedio, no son los que más bebidas isotónicas solicitan.

(5)

Figura 5. Promedio de Transacciones por Calificación (2014)

En cuanto a la distribución de ventas según la localización, la información muestra que el mayor número de transacciones se realiza en Bogotá Norte donde es 4 veces superior a la cantidad transada en Bogotá Sur. Esta información no significa que el 100% de esta cantidad se distribuya en Bogotá Norte pues según información obtenida en reunión con representantes de FEMSA, ciertos clientes que reciben los productos en centros de distribución ubicados en Bogotá Norte los trasladan a zonas en el Sur por sus propios medios. (Ver Figura 6).

(6)

Descripción de los Datos

Para lograr identificar a cuáles clientes se les debe ofrecer bebidas Powerade, se cuenta con la información asociada a las características de los clientes durante el período comprendido entre enero del 2012 y junio del 2015.

La información se organiza en las siguientes variables:

 CEDIS: Variable binaria que divide a los clientes según su localización: al sur de la calle 13 o al norte de esta.

 OUTNUM: Número de identificación del cliente

 GEC: Puntaje interno asignado a los clientes de FEMSA Colombia según la cantidad de bebidas de marca Coca-Cola que estos compran, siendo oro (O) la más alta categoría, plata (P) la segunda y bronce (B) la más baja.

 NSE: Estrato dominante en el entorno del establecimiento del cliente, lo cual se desprende de la estratificación incluida en las facturas de servicios públicos.

 CREDAT: Fecha en la cual el establecimiento se ha formalizado como cliente.

 SELMOD: Modo de venta de los productos al cliente a través de pre-vendedores, distribuidores autorizados, auto-venta y call center.

 CANAL: Canal al cual pertenece el cliente.

 SPRDAT: Fecha de salida del cliente de la lista de clientes de Coca-Cola FEMSA.  NEVERAS: Número de neveras que tiene el cliente (provistas por FEMSA).  PUERTAS: Número de puertas totales que tienen las neveras.

 LONGITUD: Distancia expresada en grados entre el meridiano del cliente y el meridiano de Greenwich a lo largo de la línea ecuatorial.

 LATITUD: Distancia expresada en grados entre la posición geográfica del cliente y la línea ecuatorial.

Adicionalmente, se posee información sobre todas las transacciones de bebidas Powerade durante el período comprendido entre enero del 2012 y junio del 2015, con los siguientes datos:

 FECHA: Fecha de la transacción: año, mes y día.

 LOCACION: Variable binaria que registra si el cliente se encuentra al sur de la calle 13 o al norte de esta.

 ARTNAM: Nombre de referencia del producto Powerade pues este tipo de bebida ofrece varios sabores.

 ARTNUM: Número de la referencia del producto.

 TRANSACCIONES: Número de unidades compradas por cliente.

La información provista por FEMSA Colombia incluye datos sobre lugares que podrían afectar el volumen de ventas del establecimiento, por ejemplo parques o gimnasios:

 NOMBRE: Nombre del sitio de interés.

 CATEGORIA: Tipos de sitio de interés clasificados en 14 categorías.

 LONGITUD: Distancia expresada en grados entre el meridiano del sitio de interés y el meridiano de Greenwich a lo largo de la línea ecuatorial.

(7)

 LATITUD: Distancia expresada en grados entre la posición geográfica del sitio de interés y la línea ecuatorial.

Con el fin de asociar a los clientes con los sitios de interés se ha identificado el número de sitios de interés de cada categoría que se encuentran a 250, 500, 750 y 1000 metros. Por ejemplo COLE 1000 representa el número de colegios localizados a menos de mil metros del cliente. También se ha identificado con base en las transacciones, los días que han pasado desde el último pedido de un cliente. En adición, se transforman algunas variables, las puntuaciones RFM y RFMM mediante el

análisis por componentes principales para obtener dos de ellos.

El data set final contiene la siguiente información adicional a data set la inicial:  Recencia: Número de días transcurridos desde la última compra del cliente.  Frecuencia: Número de transacciones promedio del año.

 Monetario: Cantidad de unidades transadas en el último año.

 Media Monetaria: Cantidad promedio de unidades transadas en el último año.  RP: Puntaje de recencia de acuerdo al análisis RFM.

 FP: Puntaje de frecuencia de acuerdo al análisis RFM.  MP: Puntaje de monetario de acuerdo al análisis RFM.

 MMP: Puntaje de la media monetaria de acuerdo al análisis RFM.

 Componente 1: Puntaje asignado al cliente para ser proyectado en el primer componente de Componentes Principales.

 Componente 2: Puntaje asignado al cliente para ser proyectado en el segundo componente de Componentes Principales.

 Cluster: Agrupación a la cual pertenece el cliente.

Metodología Aplicada

RFM

El análisis RFM se basa en asignar a cada cliente una puntuación de 1 a 5 en los siguientes factores: recencia (R), frecuencia (F) y monetario (M). La puntuación en cada factor se determina ordenando a los clientes en función de su desempeño con el objetivo de asignar a los quintiles puntuaciones de 5 a 1 de mejor a peor.

Es importante resaltar que la puntuación de cada factor es independiente de los otros. Como los clientes pueden ser exitosos en dos dimensiones diferentes, ya sea por la cantidad de unidades adquiridas, ya sea por la rotación del inventario, se realiza un análisis paralelo que consiste en cambiar el factor monetario (M) por el factor media monetaria (MM) a fin de tener en cuenta la

segunda dimensión de éxito.

Los factores de los análisis RFM y RFMM son los siguientes:

Recencia: Cantidad de días transcurridos desde la última compra. Frecuencia: Número de pedidos durante un período de tiempo.

(8)

Monetario: Cantidad de unidades adquiridas durante un período de tiempo. Media Monetaria: Promedio de unidades adquiridas.

Como resultado del análisis RFM, a cada observación se le asignan cuatro (4) puntuaciones, una por cada factor evaluado. Adicionalmente, se asignan dos puntuaciones que combinan la puntuación de algunos factores en un único valor. Recencia, Frecuencia y Monetario para RFM y Recencia, Frecuencia y Media Monetaria para RFMM. El resultado debe leerse de la siguiente manera: A más

alto sea el valor de la puntuación combinada, mejor será la observación. En total, resultaron 125 combinaciones diferentes de puntaje para RFM y 125 para RFMM. Con base en la aplicación del

análisis, la calificación más alta la obtienen las observaciones con puntaje de 555.4

Clúster (Análisis de conglomerados)

El Clustering consiste en hallar sub-grupos en un data set. Los grupos se organizan de tal manera que las observaciones similares entre ellas y son diferentes a los otro sub-grupos. Es de recordar que los clústers cubren todo el rango y no se intersecan entre ellos. Es decir que ninguna observación puede pertenecer a dos clusters y todas las observaciones pertenecen a algún clúster.

El K medias Clustering, previo al algoritmo, determina el número de Clúster (K) resultantes. El algoritmo busca minimizar la varianza entre las observaciones de cada clúster. El algoritmo se desarrolla en tres pasos: Primero, asigna cada observación uno de los clústers de manera aleatoria. Segundo, calcula el centroide de cada clúster y tercero, asigna a cada observación al clúster más cercano por distancia Euclidiana al centroide. Los pasos 2 y 3 se repiten hasta que las observaciones no cambien de clúster.5

Al final del algoritmo cada observación pertenecerá a un único clúster junta a sus similares. Componentes Principales

El análisis de Componentes Principales permite resumir varias variables altamente correlacionadas a un menor número de ellas que explican la mayor parte de la variabilidad de los datos del set original. Este análisis se realiza sobre las variables independientes y no sobre las variables dependientes por lo que se considera un método no supervisado. El primer componente es el hiperplano que mejor explica la varianza de las variables por lo que minimiza la distancia Euclidiana, al hiperplano de cada observación. El segundo componente encuentra el siguiente hiperplano ubicado más cerca de los datos con base en la distancia Euclidiana y a su vez explica la siguiente mayor varianza. Esto significa que se realiza una transformación de los datos para encontrar las dimensiones que mejor explican el comportamiento de las observaciones.6

4 Ver: IBM SPSS Direct Marketing 20.

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/es/client/Manuals/IBM_SPSS_Dir ect_Marketing.pdf

5 Ver: James Gareth et alt: “An introduction to Statistical Learning”. Ed. Spinger 2014, pág. 385

(9)

Al realizar Componentes principales se reduce la dimensionalidad del problema y permite realizar otros procesos de manera más sencilla, como es, la interpretación de las características de un clúster.

GAMs (Modelo Predictivo)

Este es un modelo aditivo generalizado, GAMs, por sus siglas en inglés que calcula la suma de las influencias de cada variable independiente en la variable dependiente.

El modelo permite superar la linealidad al evaluar funciones no lineales para cada variable. Estas funciones son llamadas cubic splines pues crean polinomios de grado 3 en varios rangos del dominio de la variable. El número de rangos es definido con grados de libertad los cuales se utilizan para calibrar el modelo. En consecuencia, a mayor grado de libertad mayor número de particiones en el rango de la variable lo que resulta en mayor número de cubic splines. Un mayor número de cubic splines aumenta la flexibilidad del modelo al ajustarlo a las observaciones con mayor precisión.

Una de las grandes ventajas que tiene el modelo es que al ser aditivo se puede apreciar la influencia de cada variable independiente en la variable de respuesta.

Resultados Obtenidos

Con el fin de hacer comprensible la aplicación de la metodología y evitar una presentación extensa se explican a continuación los resultados generales en todos los canales y para resultados específicos se muestran para el canal Tiendas de Barrio.

RFM

Al aplicar el análisis RFM y RFMM se logró calificar el desempeño de los clientes. Los resultados en

RFM muestran que más del 10% de los clientes en los cuatro (4) canales estudiados recibieron puntuación perfecta, mientras que en RFMM ningún canal superó este porcentaje de clientes. En

ambos análisis, el canal Mini-mercados registra mayor porcentaje de clientes con puntuación 555 siendo las Tiendas de Barrio las que obtienen el porcentaje mas bajo.

A partir de resultados del análisis RFM y RFMM se concluye que el RFMM es un análisis más exigente

por cuanto reduce al 50% la cantidad de clientes con puntuación perfecta identificados en el análisis RFM. De todas formas, es importante señalar que no solamente los clientes con puntuaciones perfectas son aquellos exitosos. (Ver Tabla 1).

(10)

Tabla 1. Puntuaciones Perfectas por Canal, RFM y RFMM

Canal Puntuación Perfecta Porcentaje Factores

Cigarrería / Licorería 157 11.28% Recencia

Frecuencia Monetario

Mini-mercados 445 24.28%

Panadería 328 10.59%

Tiendas de Barrio 651 10.48%

Cigarrería / Licorería 66 4.74% Recencia

Frecuencia Media Monetaria

Mini-mercados 177 9.66%

Panadería 117 3.78%

Tiendas de Barrio 208 3.35%

Clústers

Al segmentar a los clientes se identificaron vecinos comportamentales y características comunes. A partir de los puntajes de RFM y RFMM se realizó el análisis de conglomerados para cada uno de los

canales por lo que se encontraron los clúster con mejor desempeño, la cantidad de clientes en cada uno de ellos y su ubicación geográfica en el mercado de Bogotá.

Se presenta a continuación como ejemplo del análisis, los resultados del canal Tiendas De Barrio: En la tabla 2 con base en el análisis RFM, se observa que el Cluster 3 es definitivamente el mejor por presentar puntuaciones más altas en R (4.59), F (4.6) y M (4.58). Esto quiere decir que los clientes del clúster 3 han realizado la última compra en un período menor de días, en relación con la que registran los demás, tienen mayor frecuencia de compras y mayor cantidad de unidades tranzadas en el año estudiado. A su vez, el Cluster 4 registra la segunda mayor puntuación en F (4.07) y M, la segunda mayor (4.09), lo que significa que los clientes del clúster 4 demandan con mayor frecuencia y mayor cantidad. Es de anotar que los clientes de este clúster realizaron la última compra en un período de tiempo mayor al registrado para los clúster 3, 5 y 1.

Tabla 2. Resultados de Conglomerados. Canal Tiendas de Barrio RFM

Cluster R F M

1 2.57 2.31 2.2

2 1.24 2.48 2.44

3 4.59 4.6 4.58

4 2.5 4.07 4.09

5 4.25 2.58 2.49

En la tabla 3, con base en el análisis RFM, se observa que el Cluster 3, además de tener las mejores puntuaciones tiene el mayor número de clientes. En tanto, el clúster 4 agrupa el 14.2% de los clientes pertenecientes al canal Tiendas de Barrio y se ubica como el segundo clúster más pequeño. A pesar de haber encontrado dos clúster, 3 y 4, con buenas puntuaciones RFM, en el clúster 4 se agrupan menos de la mitad de clientes con respecto al clúster 3.

(11)

Tabla 3.Tamaño de Conglomerados. Canal Tiendas de Barrio RFM

Cluster Frecuencia %

1 1284 20.7%

2 1551 25.0%

3 1922 30.9%

4 882 14.2%

5 574 9.2%

En la figura 7 se muestra la distribución de los clientes del clúster 3 analizado con RFM para el canal de Tiendas de Barrio. Se puede apreciar una mayor concentración de clientes del clúster 3 al Noroccidente de la localidad de Kennedy mientras que al occidente de Teusaquillo no se evidenciaron clientes de este clúster.

Figura 7. Localización de Clúster 3 RFM. Canal Tiendas de Barrio.

En la tabla 4 con base en el análisis RFMM se observa que el clúster 4 presenta los mejores valores en

R (4.21), F (4.35) y MM (4.48) si bien ocupa el segundo lugar en R y F tiene la mejor puntuación en

MM mientras que el clúster 5, si bien tiene las mejores puntuaciones en R (4.6) y F (4.58) presenta la

más baja calificación en MM (1). Esto significa que los clientes del clúster 4 son los mejores en todos

los factores por cuanto el clúster 5 a pesar de estar mejor punteado en recencia y frecuencia, en promedio realiza adquisiciones de pocas unidades (MM=1).

(12)

Tabla 4. Resultados de Conglomerados. Canal Tiendas de Barrio RFMM

Cluster R F MM

1 1.3 2.2 1.91

2 2.72 2.76 3.13

3 2.73 3.47 1

4 4.21 4.35 4.48

5 4.6 4.58 1

Con base en el análisis RFMM, en la tabla 5 se evidencia que la mayor cantidad de clientes se

encuentra en el Cluster 4 (34%) mientras que esta cantidad es menor en el Cluster 5 (7%). Esto indica que la mayor parte de los clientes de Tiendas de Barrio pertenecen a uno de los clústers mejor calificados, el 4 de RFMM, mientras que los clientes del clúster 5 son relativamente pocos.

Tabla 5.Tamaño de Conglomerados, Canal Tiendas de Barrio RFMM

Cluster Frecuencia %

1 1582 25.5%

2 1688 27.2%

3 365 5.9%

4 2118 34.1%

5 460 7.4%

La localización de los clientes del canal Tiendas de Barrio según el análisis RFMM se distribuyen en

Bogotá como se presenta en la Figura 8. Se podría concluir que los clientes tienden al concentrarse en el occidente de Bogotá y que hay zonas de la ciudad donde ciertos canales se destacan sobre otros. De todas formas es preciso señalar que con esta sola información no es posible llegar a conclusiones más certeras por cuanto algunas mayores densidades de los puntos podrían explicarse en una mayor densidad poblacional o de edificaciones en altura en algunas zonas de la ciudad.

(13)

Figura 8. Localización de Clúster RFMM. Canal Tiendas de Barrio.

De otra parte, también se concluye que, a partir del análisis RFMM no existen clúster que se

destaquen de manera significativa sobre el resto. En contraste, en el análisis RFM es posible identificar los clúster que sobresalen con respecto a otros. La no predominancia de un clúster sobre otros en el análisis RFMM se explica en la existencia de dos dimensiones de éxito: 1) clientes con

grandes volúmenes de compra, frecuencia media y recencia baja y 2) clientes con bajo volumen de compra y frecuencia y recencia altas.

Componentes Principales

En el primer componente se define por el comportamiento de los cuatro factores R, F, M y MM . Esta

medición se interpreta de la siguiente manera: a menor valor asignado al clúster, el volumen de compras es mayor, debido a que los valores de los factores del componente son negativos. Según los resultados de este componente, se presenta un comportamiento diferente al resto en el canal de Panaderías donde su valor es directamente proporcional al volumen de ventas. (Ver tabla 6). Se asocia este componente a la primera dimensión de éxito.

En el segundo componente se define por el comportamiento de los tres factores R, F, y MM. No se

tiene en cuenta el factor M debido a que este componente se ve modificado por la cantidad de compras realizadas durante el año estudiado. Esta medición se interpreta de la siguiente manera: si el valor de este componente es mayor, el clúster tendrá una mayor rotación de inventario. Según los resultados en este componente, se presentan comportamientos diferentes en los canales de panadería y de licorería/cigarrería. En el caso del canal panadería no se tiene en cuenta el factor de frecuencia (F). En licorería/cigarrería el valor resultante del clúster es inversamente proporcional a un buen desempeño en recencia (R) y frecuencia (F). (Ver Tabla 7). Se asocia este componente a la segunda dimensión de éxito.

(14)

Tabla 6. Coeficientes de Primer Componente por Canal.

Componente Principal 1 R F M MM

Tiendas de Barrio -0.533 -0.469 -0.506 -0.49 Mini-mercados -0.514 -0.537 -0.565 -0.358

Panadería 0.522 0.457 0.493 0.525

Licorería / Cigarrería -0.544 -0.457 -0.499 -0.497

Tabla 7. Coeficientes de Segundo Componente por Canal.

Componente Principal 2 R F M MM

Tiendas de Barrio 0.579 0.152 -0.801

Mini-mercados 0.365 0.199 -0.908

Panadería 0.687 -0.722

Licorería / Cigarrería -0.576 -0.153 0.802

Según los resultados de la Tabla 8. para el caso de las Tiendas de Barrio los clústers 1 y 2 tienen peor desempeño en los dos componentes. El clúster 3 se asocia con clientes pequeños con alta rotación de inventario mientras que el 4 se asocia con Tiendas grandes las cuales tienden a realizar pedidos más grandes. El clúster 4 tiene más del doble de clientes que el clúster 3 y agrupa el mayor número de clientes por más del doble al clúster 3. Sin embargo la suma de los clientes de los clusters menos exitosos es mayor a la suma de los clusters de clientes exitosos.

Tabla 8. Clústers. Canal Tienda de Barrio y sus Componentes.

Clusters: Tienda de Barrio Componente 1 Componente 2 Tamaño

1 2.5475 0.1612 1851

2 0.3807 -0.8027 1691

3 -0.5910 2.2812 715

4 -2.5238 -0.2924 1956

Modelamiento

Se aplica siete (7) modelos GAMs diferentes, uno para cada dimensión de éxito por cada canal a excepción de canal Mini-mercados por cuanto este solo cuenta con una dimensión de éxito.

El entrenamiento del modelo GAMs se realizó aplicando el método de 10 Fold Cross Validation variando los grados de libertad entre 5 a 15. Se realizaron dos pruebas de eficiencia fin de validar el modelo. En el modelo la variable X0 corresponde a las tiendas no exitosas y la variable X1 a las exitosas. El modelo presenta dos tipos de errores: clasificar un cliente no exitoso como exitoso (falso positivo) y un cliente exitoso como no exitoso (falso negativo). La proporción entre los dos tipos de errores fue controlada definiendo un threshold, entendido como la probabilidad mínima para calificar un cliente como exitoso, al cual le fue asignado un valor de 0.7. Los dos tipos de errores y los aciertos se muestran en la matriz de

(15)

confusión del canal Tienda de Barrio en la segunda dimensión de éxito: clientes con bajo volumen de compra y frecuencia y recencia altas. (Ver Tabla 9).

Tabla 9. Matriz de Confusión. Canal Tiendas de Barrio en Segunda Dimensión de Éxito.

X0 X1

FALSO 231 189

VERDADERO 705 162

De otra parte, se evaluó el desempeño de los modelos bajo el criterio de Área bajo la curva. La forma en que este criterio se lee es que a mayor área bajo la curva, mejor será el modelo. Esto equivale a decir que las variables que el modelo ha determinado como significativas influyen realmente en el éxito de los clientes.

Es importante señalar que la gráfica muestra sensibilidad en el eje de la Y y (1- especificidad) en el eje de la X. Adicionalmente, en la gráfica se incluye una recta de pendiente 1 con un área bajo la curva de 0.5, recta que representa un modelo equivalente a lanzar una moneda para determinar el éxito del cliente. Esto significa que una mayor distancia de la curva arriba de la recta, indica que el desempeño del modelo es mejor. El threshold es máximo en la parte izquierda de la gráfica mientras que en la parte derecha es igual a cero (0). La Figura 9 muestra la gráfica del área bajo la curva del modelo para el canal Tienda de Barrio en la segunda dimensión de éxito. Se aprecia que la curva se mantiene arriba de la recta durante todo el rango y aumenta su distancia a ella en thresholds altos.

Figura 9. Área Bajo la Curva. Canal Tiendas de Barrio en Segunda Dimensión de éxito

Los resultados de aplicación del criterio Área bajo la curva muestran que los modelos de la segunda dimensión de éxito de los canales Tiendas de Barrio, Panaderías y Licorería/Cigarrería tienen un

(16)

mejor desempeño respecto a los modelos de la primera dimensión de éxito. Por su parte, el modelo de Mini-mercados presenta el mejor desempeño, seguido del modelo de la segunda dimensión de éxito del canal Tiendas de Barrio. El modelo con más bajo desempeño es la primera dimensión de éxito del canal Panadería que presenta un área bajo la curva menor a 0.5, por lo que sus resultados no deben tenerse en cuenta. (Ver tabla 10).

Tabla 10. Área Bajo la Curva de los 7 modelos.

ÁREA BAJO LA CURVA

CANALES 1ª Dimensión de éxito 2ª Dimensión de éxito

Tienda de Barrio 0.5784 0.7033

Mini-mercado 0.7054 -

Panadería 0.4656 0.632

Licorería / Cigarrería 0.5172 0.6301

El resultado del modelo GAMs para Tiendas de Barrio en la segunda dimensión de éxito evidencia las siguientes variables como significativas: i) Oro y ii) Plata, siendo plata la más determinante entre las dos. Estas clasificaciones corresponden a las definidas por Coca-Cola FEMSA para sus clientes según la cantidad de productos Coca-Cola adquiridos por estos. De otra parte, también se encuentran las variables de iii) estrato social I, iv) estrato social II y v) estrato social III, siendo el estrato social II el más determinante. Como se explicó atrás aquí se define el estrato dominante en el entorno del establecimiento del cliente, lo cual se desprende de la estratificación incluida en las facturas de servicios públicos.

Se presentan igualmente otras variables como: v) número de neveras, vi) número de puertas. Otras variables significativas encontradas respecto a la localización fueron vii) latitud, viii) longitud, y cercanía a ix) hospitales, x) bibliotecas, xi) colegios y xii) centros comerciales. Es de recordar que todas las variables de cercanías se expresan con el nombre de la categoría del sitio de interés seguida de un número. En esta denominación se representan el número de sitios de interés de esa categoría a la distancia expresada en metros. Las cuatro (4) variables de mayor influencia son la Latitud, Oro, Plata y Estrato II lo que significa que un cliente que pertenezca a estas categorías y tenga una Latitud alta tiene mayor probabilidad de ser calificado como un cliente exitoso. (Ver tabla 11).

(17)

Tabla 11. Coeficientes del Modelo GAMS para Tiendas de Barrio. Segunda dimensión de éxito

GAMS TIENDAS DE BARRIO

Variable Coeficiente Splines

Intercepto -48.33 No

Oro 1.99 No

Plata 0.76 No

Estrato I 0.16 No

Estrato II 0.37 No

Estrato III 0.31 No

Hospitales 750 0.09 No

Hospitales 500 -0.47 No

Bibliotecas 1000 -0.32 No

Bibliotecas 750 0.26 No

Número de Neveras -0.11 No

Número de Puertas 0.34 No

Colegios 250 -0.01 Si

Colegios 500 -0.02 Si

Colegios 750 0.05 Si

Colegios 1000 -0.04 Si

Centro Comercial 750 0.26 Si

Centro Comercial 1000 0.15 Si

Longitud -0.42 No

Latitud 3.24 No

De los 7 modelos GAMs diseñados se concluye que sólo dos modelos, Mini-mercados y Tiendas de Barrio de la segunda dimensión de éxito, permiten contar con información que le permita a Coca-Cola- FEMSA mejorar su inserción en el mercado.

Conclusiones

A pesar de la buena aproximación lograda con la aplicación de la metodología a los datos puestos a disposición para el presente estudio de caso, se concluye que es necesario realizar un mejor modelamiento con un mayor nivel predictivo que permita lograr el objetivo planteado de aumentar al 21% la participación del productos Powerade de Coca-Cola FEMSA en el mercado de Bogotá. El análisis RFM es un buen método para asignar puntajes que soporten la segmentación de los clientes. Sin embargo, al tener un número tan elevado de clientes por calificar, se presentan fallas en este análisis. Es así que cuando todos clientes del mismo canal son calificados sin tener en cuenta,

(18)

por ejemplo, su localización o el estrato social dominante en su entorno, se puede calificar de manera errónea a un cliente. Vale decir que un cliente que tiene un buen puntaje RFM respecto a otros clientes con características similares, sea calificado con bajo desempeño frente a todo el set de clientes. En estas circunstancias, sería conveniente realizar una segmentación previa al análisis RFM. Este mismo razonamiento se puede realizar para RFMM.

El clustering resulta ser una buena herramienta para separar la muestra en clúster de clientes con características similares por su puntuación RFM y RFMM. Si bien en la aplicación de esta herramienta

no se realizó sobre variables como la localización geográfica y ni la estratificación, esto parece ser conveniente a fin de lograr resultados que permitan diseñar mejores estrategias para Coca-Cola como por ejemplo, marketing diferenciado y aplicar metodologías más precisas a los agrupaciones encontradas.

El modelamiento a través de GAMs es un método eficiente para encontrar en qué medida influencia cada variable en el éxito de los clientes. Con el fin de obtener mayor información se deberían realizar nuevos modelos reduciendo las variables de entrada para determinar la influencia de algunos factores, sin tener en cuenta otros que pueden estar atrapando gran parte de la varianza pero que ofrecen poca información. Es el caso de la calificación oro asignada al cliente pues esta ya informa sobre la alta cantidad de productos adquiridos.

También es de señalar que el modelo GAMs, por su naturaleza aditiva, no tiene en consideración interacciones entre variables que podrían ser importantes, como la combinación entre Latitud y Longitud. Sin embargo, este inconveniente puede ser superado aplicando otros modelos que tengan en consideración interacciones, sacrificando la interpretación. Así, las interacciones significativas pueden agregarse al modelo GAMs original para incluir y determinar su influencia.

Por su parte, el análisis de Componentes Principales permite determinar el éxito de los clientes en dos dimensiones diferentes que son fácilmente interpretables y cuantificables gracias a los puntajes RFM RFMM. Este análisis se presenta como la mejor aproximación para estimar las dos dimensiones

de éxito señaladas en este caso de estudio: 1) clientes con grandes volúmenes de compra, frecuencia media y recencia baja y 2) clientes con bajo volumen de compra y frecuencia y recencia altas.

Propuesta de desarrollos futuros

Teniendo en cuenta que los estratos 2 y 3 son aquellos donde se registra un mayor número de ventas totales y un menor número de ventas promedio, podría de interés para Coca-Cola FEMSA realizar un estudio dirigido a estos estratos. Con los nuevos resultados podrían realizarse campañas publicitarias en zonas donde predominan estos estratos, enfatizando el hecho de que Powerade tiene un precio menor al de su mayor competidor Gatorade y así explotar esta ventaja competitiva7.

Igualmente, se podrían segmentar los clientes por zonas geográficas, dado que las diferencias socio-económicas entre zonas de la ciudad pueden ser una variable significativa. También podrían tomarse en consideración variables como la densidad poblacional y constructiva, en ciertas zonas entre otras variables que pueden marcar la diferencia en el comportamiento de los clientes respecto

(19)

al mercado de bebidas isotónicas. Otra variable importante que no fue considerada se relaciona con la localización de los clientes en la ciudad de Bogotá, es la presencia de publicidad Powerade. Se parte del supuesto de que una mayor cantidad de publicidad en ciertas zonas de la ciudad explicaría mayores adquisiciones de clientes allí ubicados, frente a menores adquisiciones por parte de otros donde la publicidad es escasa o inexistente.

Además, estudios futuros deben tener en cuenta la competencia de Powerade por parte de otras bebidas isotónicas. Podría ser de gran valor contar con información sobre los comportamientos de la competencia para compararlos con las bebidas isotónicas de Coca-Cola FEMSA. Si los mercados fuesen similares, la firma debería centrarse en llegar a mercados diferentes, no atendidos. Si la competencia atendiera también otro nicho del mercado, Powerade no sólo debería llegar al mercado desatendido sino entender también las razones que explican su ausencia en el mercado de la competencia. De la mano, se debería de realizar encuestas de satisfacción y un piloto, con el objetivo de obtener resultados para realizar nuevos análisis para problemas supervisados y así conocer si las estrategias aplicadas son efectivas.

En conclusión la metodología aplicada en el caso de estudio tiene fuerte fundamento teórico y los modelos de Mini-mercados y Tiendas de Barrio en la segunda dimensión de éxito son confiables. Sin embargo hay muchas otras oportunidades para aplicar la misma metodología con las variaciones antes señaladas y en consecuencia, obtener más y mejor información.

Referencias

Documento similar

Modelos ARIMA preliminares de las series de tiempo de precipitación y caudales observados en la hoya hidrográfica Quebrada La vieja .... Parámetros morfométricos del área de

Las variables que se midieron en campo para alimentar los modelos de cálculo de área basal, biomasa, cobertura arbórea y volumen fueron el diámetro normal (DN), la

Factores Críticos de Éxito y Competencias Clave para los modelos atómicos: Directo al Consumidor y Proveedor de Servicios Completos Tabla 4: Procesos de Negocio más acordes para

La segunda etapa es la de crear una herramienta que le permita a la coordinación del área actualizar la información de nuevas especialidades, insertar un nuevo valor de demanda

En la segunda fase, se estudia el segundo método de reducción de índice, es decir, en el numeral 7.3 muestran los resultados para los problemas planteados a

Calidad de los modelos de regresión obtenidos tras la segunda segmentación Como se puede observar en la Tabla 4, el MMRE obtenido para los tres sub-grupos obtenidos a partir

Siguiendo esta línea de investigación utilizaron con éxito el desequilibrio en el perfil F- V como un criterio para individualizar y reorientar el programa de entrenamiento, cuyos

Se comparó la prevalencia de alteraciones en el perfil fermentativo (área bajo la curva de concentra- ción de hidrógeno excretado/tiempo), entre pacientes con y sin tratamiento