Cynthia Fonderson
15. Juillet 2021

Analyse des transactions de la clientèle d'une épicerie

Posté le 15. Juillet 2021  •  2 minutes  • 366 mots

Le but de ce projet était d’analyser les transactions des clients afin d’étudier et d’interpréter les comportements des clients d’un certain epiceur. Pour ce projet, je vais utiliser des méthodes de ML non supervisées pour réduire la dimensionnalité de ces données, et tracer les données 2-D résultantes, et étudier ce que les modèles apprennent.

Plan du projet

  1. Ingestion de données
  2. Analyse exploratoire des données
  3. Analyse en composantes principales
  4. Analyse en composantes principales à noyau
  5. Classification K-Means avec la méthode du coude
  6. Analyse interactive par grappes



Ingestion de données

L’ensemble de données utilisé a été collecté par Margarida G.M.S. Cardoso, et comprend les dépenses annuelles pour différents types de produits de détail (par exemple, les produits surgelés, l’épicerie, la charcuterie, etc.) et peut être trouvé ici . Vous trouverez ci-dessous les cinq premiers enregistrements de l’ensemble de données : df



Analyse exploratoire des données

J’ai commencé l’analyse des données exploratoires en examinant la distribution des variables, qui a révélé que la plupart des transactions étaient inclinées vers la gauche et quelque peu corrélées. df



Analyse de groupement

Avant d’effectuer l’analyse de clustering, j’ai décidé de réduire la dimensionnalité des données en utilisant l’analyse en composantes principales. Malheureusement, cela n’a pas fonctionné, car les données n’étaient pas linéairement séparables. Par conséquent, j’ai procédé à la transformation des données en utilisant une fonction cosinus via un Kernel PCA. df



L’analyse de clustering a été réalisée à l’aide de l’algorithme KMEans (no_clusters=3), en utilisant la méthode Elbow pour déterminer le nombre idéal de clusters. Trois clusters de clients ont été trouvés :

Groupe 0 : Clients au pouvoir d’achat élevé, qui achètent des produits d’épicerie, du lait et des détergents dans ce magasin. Groupe 1 : Clients qui achètent des articles de toutes les catégories, mais qui dépensent surtout de l’argent pour les aliments frais. Les consommateurs de ce groupe ont le plus faible pouvoir d’achat de tous les groupes. Groupe 2 : Clients à fort pouvoir d’achat, qui achètent principalement des produits frais et surgelés dans ce magasin. df



Suggestions pour le propriétaire

Si le magasin devait utiliser ces résultats pour affiner sa prochaine campagne, il pourrait concentrer son attention sur les clients du groupe 1 pour voir ses ventes augmenter.

Projet complet

Contact me / Contactez-moi

I work on everything data / J'aime tout ce qui concerne la science des données.