datosciencia
Mi proyecto:
🟣 He realizado un análisis exhaustivo de los datos de la tienda Gourmet Shopmyseke, para poder ayudar a la Tienda Shopmyseke aumentar sus ventas y maximizar sus beneficios.
La analítica web ha sido utilizada para identificar el comportamiento de los clientes, optimizar el sitio web, para mejorar la experiencia del usuario, aumentar las tasas de conversión, recomendar productos de forma más eficaz y descubrir tendencias en los datos de los pedidos.
Además, la analítica web ayudó a la tienda a descubrir nuevos mercados y clientes potenciales mediante un análisis detallado de las fuentes de tráfico del sitio web.
🟣Las empresas deben comprender cómo interactúan los clientes con su sitio web para tomar decisiones informadas sobre las campañas de marketing, las ofertas de productos y las actividades promocionales.
🟣 Te invito a explorar las profundidades de tus datos. Sumérgete y descubre los secretos que encierran.
Resumen Ejecutivo
Proyecto Tienda Gourmet Shopmyseke
Los datos que han sido objeto de estudio son de los años 2019 y 2020.
Son datos reales de la tienda gourmet Shopmyseke.
En las siguientes gráficas podéis ver algunas perspectivas muy curiosas/ interesante sobre el análisis de Clientes y Productos.
En las dos gráficas de abajo (figura 1 y figura 2) vemos que los productos más vendidos son Harina de Bellota pelada, Terrius 1kg, Harina de Bellota pelada, Terrius 200gr y Aceituna Aliñada de la Abuela 200 gr. José Lou y los menos vendidos son Cesta Gourmet Alêm Tejo, Licor de Ginja y Cestas de Sabores del Atlântico.
Los productos menos vendidos están casi al mismo nivel porque se venden muy poco.
Figura 1: Los productos Más Vendidos
Figura 2: Los Productos Menos Vendidos
En la figura 3, gracias al análisis de datos hemos podido descubrir que las categorías más importantes para la tienda son Conservas de Vegetales, Vinos Portugueses y Españoles y Aceites y Salsas.
Toda esta información la podéis ver en la figura 3.
Figura 3: Las Categorías Más Vendidas
En la figura 4, en el eje X tenemos los productos de la tienda y en el eje y tenemos el número de ventas y el radio del círculo representa el número de letras de la descripción del producto.
El producto Harina de Bellota tiene una descripción muy trabajada y comparada con la descripción de la Bellota Tostada que tiene una descripción más corta y observamos que el primer producto ha sido mucho más vendido.
Cabe destacar que de los productos más vendidos encontramos también descripciones cortas como por ejemplo la Aceituna Aliñada de la Abuela, el producto Vino Muralhas y el producto Grelos.
Figura 4: Las ventas de productos relacionadas con el Numero de Caracteres:
En la figura 5 representa un wordcloud de un producto y a golpe de vista podríamos ver las palabras más destacadas serían harina, bellota
Estas son las palabras claves que impactan más en la descripción del producto.
Figura 5: Wordcloud de las Descripciones de Productos
En la figura 6, podemos ver que los productos más visitados son el licor Amarguinha pero no es el producto más vendido. En este caso podemos ver que las visitas no representan ventas.
Figura 6: Los Productos con más Sesiones
En la figura 7 asistimos que hay productos que no se venden y con pocas sesiones y asistimos que hay producto que no se vende, pero tienen muchas visitas, estas visitas pueden venir de tráfico orgánico o de Ads.
Figura 7: Los Productos menos Vendidos vs Sesiones
La Figura 8, asistimos que entre los clientes de la tienda hay un número pequeño de los mismos, que no quieren responder si son hombres o mujeres porque no quieren dar sus datos, lo que dificulta poder interactuar con ellos después de la compra.
Según los datos de la tienda, esta tiene más clientes del sexo femenino, que del sexo masculino.
Figura 8: Clientes
Newsletter:
En la figura 9, vemos que los clientes no se suscriben a la Newsletter, solamente se suscriben cuando hay campañas de ofertas, de cupones y son los clientes del sexo masculino los que más se suscriben.
Figura 9: Newsletter cuando un cliente se registra en la web
Método de Pago en la Web:
En la figura 10, el método de Pago elegido por los clientes es la tarjeta bancaria seguido del Paypal.
Figura 10: Método de Pago elegido por los clientes
Ciudades:
En la figura 11, las ciudades a donde más ha vendido la tienda ha sido Pontevedra, Vigo, Santo António dos Cavaleiros (Portugal) y Burgos.
Figura 11: Ciudades de destino
En la figura 12, muestra los países donde la tienda más vende, destacando que 89% son países europeos. La mayoría de las ventas se producen en España, Francia y Portugal.
Figura 12: Países a donde ha vendido la Tienda Gourmet
En la figura 13, la empresa de logística que mejor trabajaba para los países de Europa de Norte era Fedex y para el mercado interno (Península Ibérica) era MRW.
Figura 13: Países a donde ha vendido la Tienda Gourmet
Idioma:
En la figura 14, el idioma que más ha sido utilizado para realizar las compras en la tienda ha sido el castellano, seguido del portugués y del francés.
Figura 14: Idioma elegido para comprar
Ventas por Mes:
En la figura 15, vemos que los meses de mayores ventas para esta tienda son durante los meses de Agosto, Octubre y Diciembre por las Cestas de Navidad.
Figura 15: Distribución de las ventas a lo largo de los meses
Horas:
En la figura 16, las horas con mayores visitas a la tienda es alrededor de las 11h, 17h y las 22h.
Aquí podremos adaptar nuestras campañas de Ads, promocionar productos, bundles para incentivar a la compra.
Figura 16: Las Visitas a la tienda por Horas
Cómo se distribuyen los clientes en cuanto a gasto:
En la figura 17, vemos que la gran mayoría de los clientes han gastado menos de 50€. Hay algunas personas que gastaron casi 500€, pero es algo muy raro, son compras de empresas que necesitaban de un producto en específico.
Figura 17: Gasto Total por Cliente
N.º de Compras por Cliente:
En la figura 18, podemos ver que la gran mayoría de los clientes sólo hace una o dos compras. Existe gran recorrido para mejorar este ratio mediante: Email Marketing con ofertas personalizadas.
Figura 18: N.º de Compras por Cliente
¿Cuántos productos compra un cliente de media en cada compra?
Mediana Max Min
2 30 1
· La compra mediana incluye 2 productos.
· El 50% de los clientes compran 2 productos en la misma compra.
· El máximo de productos comprados fue de 30.
· Existe gran recorrido para mejorar este ratio mediante: Sistemas de Recomendación en el momento de la compra.
¿Qué clientes nos han generado más ingresos?
Para calcular el gasto total medio por cliente:
Media Mediana Mínimo Máximo
49 24 2 527
Existen clientes con gasto medio decenas de veces superior a la media. Hay que fidelizar estos clientes mediante programas de fidelización.
¿Cuál es la supervivencia de los clientes?
Queremos ver cuánto tiempo aguantan los clientes con la tienda Gourmet.
En la figura 19, podemos ver que casi el 100% de los nuevos clientes, no vuelve a comprar en los meses posteriores.
Figura 19: Supervivencia de los clientes
¿Cuál es el LTV de los clientes?
LTV = Life time value (calcular cuál es el importe que un nuevo cliente se va a gastar con nosotros, pero no ahora, pero si a lo largo de la vida del cliente).
Conseguir un nuevo cliente tiene un coste CPA (publicidad, email mktg, panfletos, contenidos = coste de Captación).
LTV está condicionado a un periodo temporal.
Con los datos de un año podríamos calcular LTV a 3M, a 6M y LTV a 12Meses.
El CPA tiene que ser inferior al LTV.
¿Por cada nuevo cliente que yo consigo captar, cuanto me va a generar en los próximos 12 meses?
Media Mediana Desviación Típica Mínimo Máximo
158 158 64 112 203
Esto quiere decir que cada nuevo cliente tiene un Life Time Value de 158€ a 12 meses. Podemos invertir como coste de adquisición un % de 158€.
Eso significa que el CPA que podemos asumir tendrá que ser inferior a 158€.
¿Sobre qué clientes ejecutar las próximas campañas (RFM)?
Es una técnica llamada (segmentación) RFM (Recency - Frequency - Monetary).
R = mide la última vez que el cliente ha comprado a nosotros. O sea, el cliente que compró hace un mes repite más fácilmente la compra do que un cliente que compró hace un año.
F = Cuantas veces ha comprado el cliente, o sea, el cliente que compra 10 veces es mejor que el cliente que compró solamente dos veces.
M = Mide el importe total gastado por los clientes.
En la figura 20, somos capaces de identificar los clientes que con mayor probabilidad responderán mejor a nuevas campañas, además de obtener un montón de insights valiosos para el negocio.
Figura 20: RFM
Esta técnica es muy utilizada en Retail - Segmentación RFM porque:
Ø Permite segmentar y atribuir un valor a esos mismos clientes.
Ø Segmentar a los clientes VIP - atención personalizada, usando un canal más cercano porque generan más compras.
Ø Identificar los clientes nuevos para incentivar a la compra recurrente.
Ø Identificar la cantidad de clientes que no compran hace mucho tiempo y lanzar campañas de reactivación e invertir más tiempo y recursos.
Entendiendo los productos:
¿Cuál es la relación entre el precio y el volumen de ventas?
"ANÁLISIS ELASTICIDAD DEL PRECIO"
En la figura 21, podemos comprobar que existe una clara relación decreciente entre el Precio y la Cantidad vendida. Cuando sube el precio bajan las compras.
Hay una sensibilidad al precio, los clientes compran más productos con un precio más bajo do que los productos con precios más altos. Las ventas se producen en los productos muy baratos, o sea, el Ecommerce no estará teniendo o sacando mucha rentabilidad porque cuanto menor es el precio menor es la rentabilidad.
Se podría encadenar una estrategia de venta cruzada, asociar los productos más caros a los productos más baratos con una oferta interesante que podría aumentar el ticket medio.
Figura 21: Relación Producto vs Precio
En la figura 22, destacamos que la mayoría de los clientes están satisfechos con calidad de los productos.
Valoraciones Rating - Numero de estrellas de 1 hasta 5 –
Figura 22: Rating dado por los clientes a los productos
Trabajo Realizado
Importación de Datos
nombre_fichero_datos = 'Union_cat_num.csv'
ruta_completa = ruta_proyecto + '/02_Datos/01_Originales/' + nombre_fichero_datos
df1 = pd.read_csv(ruta_completa)
Calidad de Datos
df1.drop(columns = 'Unnamed: 0',inplace = True)
df1.info()
Transformación de Variables
for i in range(0, len(df1['city'])):
df1.loc[i, 'city'] = df1.loc[i,'city'].lower()
for i in range(0, len(df3)):
df1.loc[i,"total_paid"] = float(df1.loc[i,"total_paid"].replace(",","."))
df1.loc[i,"product_price"] = float(df1.loc[i,"product_price"].replace(",","."))