yvienslar Le 14 mars 2022

Optimiser les assortiments grâce à la standardisation des données produit

La gestion des assortiments est une problématique complexe mais très stratégique pour les enseignes de distribution. Cependant, son optimisation repose sur un élément crucial : la qualité des données produits. Chez YZR, nous proposons une solution d’uniformisation automatique de ces données.

Julien et Anna mangent tous les matins des céréales au petit-déjeuner. Tandis que l’un en achète toujours au chocolat, l’autre aime bien varier les plaisirs et faire des mélanges. D’autre part, l’un passe toujours du temps à trouver la référence la moins chère tandis que l’autre regarde en priorité les marques de qualité. Pour un distributeur, comment faire en sorte de satisfaire à la fois Julien et Anna ? C’est le problème de la gestion des assortiments. Ce sujet s’avère vite être un véritable casse-tête. Selon la Fédération du Commerce et de la Distribution, un hypermarché en France peut contenir jusqu’à 40 000 produits différents, dont environ un tiers est renouvelé chaque année. Cette démarche est pourtant essentielle pour les distributeurs : augmenter les volumes, mieux gérer les stocks et surtout faire en sorte que le bon produit soit au bon endroit et présenté devant les bonnes personnes.

Ce problème dépend en réalité de nombreux facteurs socio-économiques comme les revenus moyens des clients, la situation géographique ou encore la surface des magasins. C’est pourquoi, des modèles statistiques sont employés pour déterminer les principales causes qui conduisent un client à acheter un certain type de produit. Seulement voilà, les méthodes actuelles se basent sur des données de produits très mal décrites. Les catalogues de références, sous forme de tableaux Excel, contiennent en réalité des centaines de lignes, souvent remplis de fautes d’orthographe et d’abbréviations. « Orenge » à la place d' »Orange » ; « frts » à la place de « fruits », les exemples sont nombreux et dus au fait qu’ils sont écrits à la main par des opérateurs humains. Ces erreurs textuelles dégradent les prédictions et empêchent alors les modèles statistiques d’être pleinement fonctionnels.

On le voit ici, le problème vient du caractère manuel de la saisie des données par des humains. Une solution pourrait donc être d’adopter un outil qui viendrait automatiquement corriger ces erreurs, avec à la clef une gestion des assortiments optimisée.

‍

À quoi sert la gestion des assortiments de produits ?
‍

Un assortiment est une collection, plus précisément il s’agit du nombre d’articles différents dans une catégorie de produits.

Étant donné que l’espace disponible en magasin est fini, il convient de placer les bonnes associations d’articles au bon endroit pour :

Stimuler les ventes
Fidéliser la clientèle
Assurer une rotation efficace des stocks
Définir un positionnement de l’enseigne et développer son image de marque (en termes de prix : premiers prix, haut-de-gamme ; et de choix : diversification ou focalisation).

Pour un distributeur, il s’agit donc de trouver un compromis dans la diversité des choix proposés. En effet, s’il est vrai qu’un assortiment très varié permet d’élargir sa cible de clients en permettant à chaque consommateur de trouver ce qu’il recherche, il y a un risque qu’ils soient perdus au milieu d’un trop grand nombre de références. À l’inverse, réduire la taille des assortiments augmente la lisibilité pour le client et accélère l’acte d’achat puisqu’il aura, de fait, moins de produits à comparer. Certains supermarchés préfèrent ainsi réduire le nombre de références mais augmenter celui de catégories (ne mettre des jambons que d’une seule marque mais proposer à côté des dés de jambons et de la charcuterie). C’est donc un véritable enjeu stratégique pour les entreprises de comprendre ce qui va influencer la perception des assortiments présentés aux clients.

En fait, le principal problème que rencontrent les distributeurs est que les comportements des clients sont très hétérogènes. Pour un même individu, les choix varient fortement en fonction du contexte d’achat et de paramètres sociologiques. Une personne peut vouloir acheter des biscuits premiers prix parce qu’elle ne va les consommer qu’avec parcimonie et à l’inverse choisir des jus de fruits haut-de-gamme pour son petit-déjeuner. De plus, si elle va vouloir toujours prendre le même type de jus au quotidien, elle peut être amenée à en acheter une grande variété dans le cadre d’une fête entre amis. Enfin, un autre problème lié à la gestion des assortiments de produits concerne les substituts, c’est-à-dire les produits qui peuvent être remplacés par d’autres en cas de rupture de stock. Que se passe-t’il si le jus de fruits que notre client achète toutes les semaines n’est plus disponible à la vente ? Va-t’il se tourner vers une autre marque, une autre saveur où va-t-il plutôt préférer une autre boisson ? Ce sujet influe directement la variété des références et l’association de produits au sein de différents assortiments, avec toujours pour objectif de répondre au mieux aux attentes des consommateurs.

61c44c51f1194935a8981d2b_Gestion_assortiments

Un grand nombre de paramètres est à prendre en compte pour choisir la bonne stratégie de gestion des assortiments.

Dans la pratique, comment s’effectue cette gestion et quelles en sont les limites ?
‍

Afin de définir les bons assortiments, les enseignes de distribution travaillent par catégories de produits. Une catégorie est une famille de produits : fruits et légumes, poissons, cosmétiques, produits d’entretien, etc.

Tout l’enjeu est de déterminer les comportements d’achat des consommateurs suivant la disposition des produits au sein de chaque catégorie (nombre de références disponibles, prix, associations de produits, etc.).

Pour comprendre ce qui va favoriser le déclenchement de l’achat ou au contraire ce qui va l’empêcher, des méthodes statistiques sont majoritairement utilisées.. Concrètement, il s’agit d’analyser la composition des paniers d’un très grand nombre de clients et dans des contextes très différents. Cela permet d’éliminer des biais culturels, géographiques voire socio-économiques. Dès lors, s’il s’avère que dans un magasin 90% des clients se comportent comme Anna, alors l’enseigne a tout intérêt à privilégier un assortiment très large et qui met en avant les marques possédant des labels de qualité.

‍

Cette méthode présente néanmoins deux limites :

– D’une part, de manière générale, les descriptions de produits dont disposent les analystes sont de très mauvaise qualité (pour comprendre pourquoi, lisez cet article). Ils sont souvent parsemés de fautes d’orthographe, d’erreurs de typographie voire même d’éléments non traduits. Il n’est pas rare de trouver dans un catalogue de produits des lignes avec inscrit « Frts pur jus 1l orrange » à côté de « jus d’orange pur jus 1,0 litre ». Ces problèmes textuels rendent alors très difficiles l’identification d’un produit de manière unique. Le modèle statistique ne sait pas reconnaître que les deux descriptifs représentent le même produit, ce qui va venir fractionner leur fréquence d’apparition dans l’analyse des paniers. Aussi, cette grande hétérogénéité ne permet pas de définir précisément la partie du descriptif qui correspond à la marque, à la saveur, au volume, etc. Il est donc extrêmement complexe d’identifier un comportement client comme celui de Julien ou Anna.

– D’autre part, et plus fondamentalement, cette analyse de paniers ne fonctionne pas pour les nouveaux produits qui n’ont par définition aucun historique de vente. Or, ces articles ne sont pas rares puisqu’il est estimé que le taux de renouvellement dans les magasins en France est d’environ un tiers chaque année. La solution consiste ici à réaliser des analyses de similarité sémantique, c’est-à-dire à identifier plusieurs produits ayant des caractéristiques proches et qui possèdent, eux, un historique de vente plus important. Par exemple, un nouveau shampoing bio sera à comparer avec d’autres shampoings dans la même gamme de prix mais aussi avec d’autres produits bios comme des crèmes lavantes. On constate également ici que cette approche est très difficile à mettre en œuvre lorsque les descriptions de produits ne sont pas de bonne qualité.

‍

Qu’en est-il de la substitution de produits ? Définie par la recherche de produits pouvant s’échanger mutuellement sans conséquence notable sur les ventes, la démarche est similaire. La différence est qu’on ne raisonne pas en termes de catégories de produits mais plutôt en termes de groupes de besoin. Un groupe de besoin est un ensemble de produits qui répondent au même besoin et qui sont donc substituables. Ainsi, les articles banane et fraise appartiennent à la même catégorie fruits mais ne sont pas substituables, à l’inverse des articles beurre et margarine qui appartiennent au même groupe de besoin.

La substitution de produits est utile dans plusieurs cas :

– Si le produit principal est en rupture de stock.

– Si le substitut est plus rentable ou est en promotion.

– Si le substitut, associé à un autre produit, augmente la probabilité que les deux soient achetés (un shampoing et un après-shampoing par exemple).

Dans tous les cas, il s’agit, pour un produit donné, de trouver le ou les produits qui ont le plus de chances d’être acheté à sa place. Cela dépend bien sûr de nombreux critères sur le magasin, justifiant l’approche statistique expliquée ci-dessus. On se retrouve alors avec les mêmes problématiques et en particulier celle concernant la mauvaise qualité des descriptifs de produits. Or, pour choisir le bon substitut, il est indispensable d’avoir clairement identifié les attributs qui les composent. Mais comme les historiques servant à l’analyse des ventes sont complétés à la main par divers opérateurs humains, il y a une grande hétérogénéité dans ces données, ce qui introduit beaucoup de bruit dans la recherche de similarité textuelle.

61c44c529669f589bf88449c_Qualite_donnees

Une bonne gestion des assortiments repose avant tout sur des données produits de bonne qualité

YZR : un outil de normalisation qui uniformise les données de produits et permet donc une optimisation des assortiments
‍

Pour résoudre ce problème, nous proposons chez YZR une plateforme qui vise à améliorer la qualité des données textes contenues dans des bases de données. À l’aide d’un algorithme d’apprentissage machine, notre solution peut uniformiser et labelliser les données suivant des standards et labels choisis par l’utilisateur. 3 fonctionnalités sont ainsi intégrées dans notre outil :

– Standardisation: il s’agit de remplacer, au sein des descriptifs, plusieurs groupes de mots différents (les variants) par un unique standard. Dès lors, « Frts pur jus 1l orrange » « jus d’orange pur jus 1,0 litre » deviennent « Fruits Pur jus 1L Orange » d’une part et « Jus d’Orange Pur Jus 1L » d’autre part.

– Labellisation: il s’agit d’identifier pour chaque produit des attributs correspondant à ses caractéristiques. Dans l’exemple ci-dessus, les attributs seraient « Type » (pour jus), « Saveur » (pour orange), « Volume » (pour 1L) et « Concentration » (pour pur jus).

– Fuzzy matching: étape finale du processus, il s’agit de faire correspondre plusieurs descriptifs différents et représentant le même produit. Ici, l’algorithme est capable de comprendre que « Fruits Pur jus 1L Orange » « Jus d’Orange Pur Jus 1L » désignent une bouteille d’un litre de jus d’orange « pur jus ».

À la suite de l’étape d’uniformisation des données produits, le fuzzy matching permet de reconnaître que plusieurs descriptifs correspondent au même produit.

Ainsi, en uniformisant les descriptifs de produits, notre outil rend l’analyse d’historique de paniers et la recherche de similarités sémantiques robuste et fiable. Lorsque le processus était effectué à la main, les analyses de nos clients ne s’effectuaient que sur une gamme très restreinte de produits. Grâce à YZR, ils ont pu automatiser ce traitement et effectuer des analyses sur l’ensemble de leurs catégories.

Vous souhaitez obtenir une démonstration de notre outil ? N’hésitez pas à nous contacter sur notre site web ou directement à l’adresse hadrien@yzr.ai.

Envie de mieux comprendre pourquoi la qualité des données produits est un vecteur de croissance ? Téléchargez notre livre blanc disponible ici.

Contenus liés

IA Ecommerce

Panorama des solutions IA pour le e-commerce en 2024

Découvrir

Ecommerce Étude La data au quotidien Divers

Internet : 30 chiffres clés à connaître en 2024