Powered By Blogger

Clusters para segmentar

 El Clustering es una técnica de análisis de datos utilizada para segmentar o agrupar elementos similares en conjuntos llamados clusters o segmentos. Su objetivo es dividir un conjunto de datos en varios grupos de manera que los elementos dentro de cada grupo (cluster) sean lo más similares posible entre sí y, al mismo tiempo, diferentes de los elementos en otros grupos. Esta técnica es muy utilizada en el marketing para crear segmentos de mercado y entender mejor a los diferentes tipos de clientes.

¿Por Qué Usar Clustering para Segmentar?

La segmentación de mercado permite a las empresas comprender mejor los diferentes grupos de consumidores y adaptar sus estrategias de marketing, productos y servicios para satisfacer las necesidades específicas de cada grupo. Con el clustering, puedes:

  • Identificar grupos de clientes que comparten características o comportamientos similares.
  • Personalizar estrategias de marketing, enfocando tus mensajes y promociones en cada grupo.
  • Optimizar recursos, dirigiendo los esfuerzos y presupuestos a los segmentos que tienen más probabilidades de responder a una estrategia específica.

Existen varios métodos para realizar clustering, pero el  más común en segmentación de mercado incluyen:

K-means Clustering:

  • Es uno de los métodos más populares y fáciles de implementar.
  • El analista elige un número predefinido de clusters (por ejemplo, 3, 4 o 5) y el algoritmo agrupa los datos alrededor de esos centros o "centroides".
  • La idea es minimizar la distancia entre cada punto y el centroide del cluster al que pertenece.
  • Es útil cuando tienes una idea aproximada de la cantidad de grupos en los que deseas dividir los datos.

Pasos para Realizar Clustering para Segmentación

1. Seleccionar las Variables:

Define las variables relevantes para la segmentación, como demografía (edad, género), comportamientos de compra, preferencias de pago, uso de redes sociales, entre otros.  Es importante que selecciones la que mejor se adapte al estudio que estás realizando. 
Figura 1 
Variables 

Nota. Los datos fueron obtenidos de una encuesta realizado por JANETH BELEN PINTO PAUCAR del  previo a la obtención del título en  Administración de Empresas de la Universidad Bolivariana del Ecuador para el diseño de un producto "Café con Sabor a Caramelo". 

2. Preprocesar los Datos:
  1. Asegúrate de que las variables estén en un formato adecuado (numérico, normalizado) para que los clusters no se vean afectados por diferencias de escala.
Figura 2
Enumerar las variables.


2. Elegir el Algoritmo y Configurar los Parámetros:

Selecciona el método de clustering (como K-means o jerárquico) y ajusta los parámetros (por ejemplo, el número de clusters en K-means). Es importante que descargue la versión actualizada de Jamovi  https://www.jamovi.org/download.html luego de la descarga tiene que ir a  módulos para descargar snowCluster que permitirá realizar el análisis, el algoritmo con el se trabajará es K-means Clustering como se indica en la figura 3. 
Figura 3
Elección del algoritmo.










3. Ejecutar el Análisis y Evaluar la Calidad del Clustering:
  • Observa los clusters resultantes y evalúa si tienen sentido para la segmentación de mercado. Usa medidas como la suma de cuadrados para entender la cohesión dentro de los clusters y la separación entre ellos.
  • Es importante ingresar las variables para realizar el Cluster, es importante que configure como se observa en la figura 4. Para este análisis se trabajará con 3 clusters tiene que seleccionar en "Number of clusters"  el número de clusters,  puede utilizar más dependiendo el estudio que está realizando.  
Figura 4 
Configuración para le análisis 




4 . Interpretar los Clusters:
  • Analiza las características promedio de cada cluster (edad, frecuencia de compra, etc.) para describir cada segmento y entender sus necesidades y comportamientos.

Variables Analizadas

  1. ¿En qué región vives?: Indica si la región de residencia tiene influencia en el cluster.
  2. ¿Interviene en el consumo del café el lugar donde vives?: Mide si el lugar de residencia afecta el consumo de café.
  3. ¿Qué edad tiene?: Representa la edad promedio de los miembros del cluster.
  4. ¿Qué género es?: Indica el promedio del género predominante en el cluster.
  5. ¿Con qué frecuencia consume café?: Muestra la frecuencia promedio de consumo de café.
  6. ¿Está usted dispuesto a probar un café con sabor a caramelo?: Indica la disposición a probar sabores nuevos.
  7. ¿Qué tan probable es que pruebes un nuevo café si es recomendado por otras personas como amigos, familiares, influencers o reseñas en redes sociales?: Mide la probabilidad de probar un café influenciado por recomendaciones externas.

Análisis de los Clusters

Tabla 1
Centroids of clusters Table

Cluster 1

  • Región (-0.382): Los miembros de este cluster residen en una región que influye menos en sus hábitos de consumo de café.
  • Influencia del Lugar (0.021): Casi neutra, el lugar donde viven tiene poco impacto en su consumo de café.
  • Edad (-0.563): Personas más jóvenes en comparación con los otros clusters.
  • Género (-0.464): Predominio de un género específico (probablemente masculino o femenino dependiendo de la codificación).
  • Frecuencia de Consumo (-0.050): Frecuencia cercana al promedio, aunque ligeramente baja.
  • Disposición a Probar Café con Sabor a Caramelo (-0.302): Baja disposición a probar sabores nuevos como el caramelo.
  • Probabilidad de Probar un Café Recomendado (0.056): Ligeramente dispuestos a probar nuevos productos si están recomendados.

Interpretación: Cluster 1 representa a personas más jóvenes, con hábitos de consumo moderados, baja disposición a probar nuevos sabores, pero algo influenciados por recomendaciones externas. Este grupo podría responder bien a campañas basadas en recomendaciones.

Cluster 2

  • Región (0.557): La región tiene una mayor influencia en el consumo de café.
  • Influencia del Lugar (-0.185): Menor impacto del lugar de residencia en comparación con los otros clusters.
  • Edad (0.707): Personas mayores en comparación con los otros clusters.
  • Género (0.680): Predominio de un género opuesto al Cluster 1.
  • Frecuencia de Consumo (0.017): Frecuencia promedio de consumo de café.
  • Disposición a Probar Café con Sabor a Caramelo (-0.302): Baja disposición a probar sabores nuevos, similar al Cluster 1.
  • Probabilidad de Probar un Café Recomendado (0.122): Moderadamente dispuestos a probar productos recomendados.

Interpretación: Cluster 2 agrupa a personas mayores cuya región influye en su consumo. Aunque tienen hábitos de consumo promedio y están algo influenciados por recomendaciones, su disposición a probar nuevos sabores es baja. Campañas tradicionales pueden funcionar mejor para este segmento.

Cluster 3

  • Región (-0.433): La región tiene poca influencia en sus hábitos de consumo.
  • Influencia del Lugar (0.778): Alta influencia del lugar donde viven en su consumo de café.
  • Edad (-0.081): Edad promedio en comparación con los otros clusters.
  • Género (-0.540): Predominio de un género específico diferente al Cluster 2.
  • Frecuencia de Consumo (0.216): Alta frecuencia de consumo de café.
  • Disposición a Probar Café con Sabor a Caramelo (3.284): Muy alta disposición a probar sabores nuevos.
  • Probabilidad de Probar un Café Recomendado (-0.935): Baja probabilidad de probar productos recomendados.

Interpretación: Cluster 3 agrupa a consumidores de edad promedio con alta frecuencia de consumo. Están muy dispuestos a probar nuevos sabores como el caramelo, pero no son influenciados fácilmente por recomendaciones externas. Este grupo se beneficiaría de campañas que destaquen innovación y nuevos producto

Tabla 2

Resumen Comparativo de los Clusters

Para el análisis puede utilizar Cluster plot que  es una herramienta visual clave en el análisis de clustering. Proporciona una representación simplificada de los datos, facilitando la interpretación de la relación entre clusters y sus características principales. Además, permite evaluar la calidad del clustering y ofrece información valiosa para decisiones estratégicas basadas en datos.

Figura 5

Cluster plot.



Análisis: El gráfico de dispersión Cluster Plot representa tres clusters diferenciados en un espacio bidimensional definido por las dimensiones Dim1 (23.3%) y Dim2 (18.5%), que juntas explican el 41.8% de la variabilidad total de los datos. El Cluster 1 (azul) se encuentra en el centro del gráfico y muestra una distribución moderada con cierta dispersión, indicando consumidores con características promedio. El Cluster 2 (gris), ubicado en la parte superior, es el más disperso, lo que sugiere un grupo heterogéneo con características variadas, mientras que el Cluster 3 (naranja), situado en la parte inferior derecha, es el más cohesivo y bien definido, destacándose como un segmento homogéneo y diferenciado. La ligera superposición entre Cluster 1 y Cluster 2 señala características compartidas entre estos grupos, mientras que Cluster 3 mantiene una mayor independencia, lo que facilita el diseño de estrategias personalizadas para cada segmento.


Otro gráfico que se puede utilizar es el análisis de  variable- PCA  Análisis de Componentes Principales, para poder analizar hay que identificar las variables que apuntan en la misma dirección están positivamente correlacionadas, asimismo las variables que apuntan en direcciones opuestas están negativamente correlacionadas.
Figura 6
Variables PCA.
El gráfico Variables-PCA muestra cómo las siete variables analizadas contribuyen al agrupamiento de los datos en un espacio bidimensional representado por las dimensiones Dim1 (23.3%) y Dim2 (18.5%), que en conjunto explican el 41.8% de la variabilidad total. Cada flecha indica la dirección e intensidad de la influencia de una variable, mientras que su posición refleja la asociación con los clusters.
  1. Eje X (Dim1 - 23.3%):

    • Dim1 está principalmente asociado con las variables "Región" y "Recomendaciones de probar café", que tienen una orientación hacia el Cluster 3 (naranja). Esto sugiere que este cluster está influenciado por factores sociales y geográficos, como la importancia de las recomendaciones externas y el lugar de residencia.
    • "Género" también contribuye a Dim1, pero con menor intensidad, lo que indica una influencia secundaria en la formación de los clusters.
  2. Eje Y (Dim2 - 18.5%):

    • Dim2 está dominado por las variables "Un café con sabor a caramelo" y "Consumo del café en el lugar donde vives", ambas orientadas hacia el Cluster 1 (azul). Esto indica que este grupo tiene una mayor disposición a probar nuevos sabores y que el lugar donde viven influye directamente en sus decisiones de consumo.
    • La "Frecuencia de consumo de café" también está asociada con Dim2, pero su posición más centrada sugiere una relación compartida entre Cluster 2 (gris) y Cluster 1.
  3. Distribución de las Variables:

    • "Edad" y "Frecuencia de consumo de café" se encuentran en posiciones más intermedias en el gráfico, indicando que afectan de forma más equilibrada a todos los clusters, aunque destacan un poco más en Cluster 2, que podría representar consumidores con hábitos más estables y menos influenciados por factores externos.
    • Las variables "Región" y "Recomendaciones de probar café" están altamente correlacionadas con Cluster 3, lo que refuerza su influencia social y geográfica.
  4. Interpretación de Clusters:

    • Cluster 1 (azul): Representa consumidores interesados en probar nuevos sabores, como el café con caramelo, y que están influidos por el lugar donde viven. Este grupo podría responder bien a campañas promocionales que destaquen productos innovadores y personalizados.
    • Cluster 2 (gris): Más relacionado con la "Frecuencia de consumo de café" y "Edad", representa un grupo con hábitos de consumo más regulares y estables, que podrían ser menos influenciados por estrategias de cambio o innovación.
    • Cluster 3 (naranja): Dominado por variables sociales como "Región" y "Recomendaciones de probar café", este cluster está compuesto por consumidores que son sensibles a las recomendaciones externas y están influenciados por su entorno social y geográfico.

El gráfico Variables-PCA permite identificar qué variables son más relevantes para cada cluster y cómo estas influyen en la segmentación. Cluster 1 está definido por la innovación y el impacto del lugar de consumo, Cluster 2 refleja consumidores regulares con hábitos estables, y Cluster 3 destaca por su sensibilidad social y regional. Esta información es clave para diseñar estrategias personalizadas, como promocionar sabores innovadores a Cluster 1, ofrecer beneficios de fidelidad a Cluster 2 y destacar recomendaciones e impacto social para Cluster 3.


Estrategias por Cluster:

Cluster 1 (Azul):

El perfil de este grupo muestra menor disposición a probar nuevos sabores (-0.302) y una relación neutra respecto a la influencia del lugar donde vive (0.021).  Realizar promociones que expliquen los beneficios o características únicas de los nuevos sabores, como degustaciones guiadas o contenido en redes sociales que fomente la curiosidad. Además realizar  programas de lealtad con el objetivo de incentivar la repetición de compra con descuentos o beneficios acumulativos por consumo regular de café, también se puede utilizar el marketing localizado que permite resaltar cómo el consumo de café puede ser una experiencia adaptada a las preferencias locales, conectando con la identidad regional.

Cluster 2 (Gris):

El perfil de los consumidores con mayor influencia de la edad (0.707) y género (0.680), pero menor relación con el lugar de consumo (-0.185), hay que diseñar campañas dirigidas según el rango de edad y género predominante, utilizando mensajes personalizados en canales específicos como redes sociales o correos segmentados, asimismo resaltar los atributos clásicos del café, como la calidad, el origen y las técnicas tradicionales de preparación. También se puede utilizar la colaboración con influencers  que conecten con el público objetivo (por edad y género), para crear confianza y motivar el consumo.

Cluster 3 (Naranja):

Este  perfil tiene alta disposición a probar nuevos sabores (3.284) y fuerte relación con la influencia del lugar donde viven (0.778), pero menor influencia de recomendaciones externas (-0.935). Realizar lanzamiento de productos innovadores y promover sabores exclusivos y novedosos, como café con caramelo o mezclas únicas. Este grupo estará dispuesto a experimentar si se destaca la innovación. Realizar eventos locales para organizar actividades en las regiones donde este grupo reside, como catas de café o experiencias sensoriales, para reforzar su conexión con el producto. También puede utilizar  mensajes personalizados y directos (a través de correo electrónico o WhatsApp) para evitar depender de terceros como influencers o recomendaciones, ya que este grupo no les da prioridad.






RFM

 =SI(Y(A2=5;B2=5;C2>=4);"Clientes VIP";SI(Y(A2>=4;B2>=3;C2>=3);"Clientes Leales";SI(Y(A2=5;B2<=3;C2<=3...