Retour
Hadrien Diesbecq Le 16 mars 2022

L’IA pour améliorer la qualité des données de vos produits

La mauvaise qualité des données produit est due à l’hétérogénéité des données sources.

L’un des problèmes les plus difficiles que vous pouvez rencontrer aujourd’hui avec la qualité des données de produits est leur hétérogénéité.

Comme vous le savez peut-être, les données sur les produits sont stratégiques car le choix du consommateur final repose entièrement sur leur désirabilité, leur exactitude et leur exhaustivité. C’est ce qui déclenche la conversion.

30 % des abandons de panier d’achat sont liés à une mauvaise description du produit.
(source : Shotfarm)

Cela signifie qu’ignorer la pertinence et la qualité de ces données revient à perdre des prospects engagés. Il convient également de noter que les erreurs probables dans les données relatives aux produits se soldent parfois par des problèmes juridiques et ont un impact direct sur votre image de marque. 87 % des consommateurs déclarent qu’il est peu probable qu’ils effectuent un nouvel achat auprès d’un retailer qui fournit des informations inexactes sur les produits. Et c’est compréhensible, car 52 % des consommateurs retournent leurs achats en ligne en raison d’une description produit médiocre ou erronée. (Source : Shotfarm)

Si vous êtes un retailer, une marketplace ou une marque multi-produits, et que vous recevez beaucoup de fichiers et de données de vos fournisseurs/vendeurs ou d’autres équipes internes qui créent des données sur les produits, vous êtes certainement exposé à ces problèmes.

Les données relatives à vos produits sont collectées auprès de différents fournisseurs et chacun d’entre eux possède sa propre taxonomie.

Impacts de la mauvaise qualité des données produit

Voici les cinq principaux effets d’une mauvaise qualité des données :

– Prise de décision inefficace: Des données de mauvaise qualité conduisent à de mauvaises décisions. Une conclusion est aussi bonne que les données sur lesquelles elle repose, et les décisions vitales fondées sur des données de mauvaise qualité peuvent avoir des répercussions négatives. C’est une raison supplémentaire de veiller à ce que vos données reflètent fidèlement la réalité.

Des problèmes de performance opérationnelle : Des données de mauvaise qualité sèment le chaos dans les opérations de l’entreprise qui s’appuient sur les données, des reportings jusqu’à la commande de produits, et tout ce qui se trouve entre les deux. Au lieu de se concentrer sur les activités à forte valeur business, ces problèmes de performance peuvent entraîner des efforts colossaux pour corriger les données avec un process manuel.

Le scepticisme: Les données de mauvaise qualité ne sont pas crédibles. Du temps, de l’argent et l’image d’une équipe / service / marque peuvent être endommagés si les données sont incorrectes. C’est ce qui se produit lorsque des descriptions ou des attributs de produits incertains ou incorrects sont affichés sur votre site web ou votre marketplace.

– Perte d’opportunités business:  Avec des données non granulaires et de mauvaise qualité, une entreprise peut perdre des opportunités de faire du cross ou de l’up-sell. Les données granulaires vous permettent de segmenter finement vos produits. Si vous ne disposez pas de données granulaires et que vous vous en tenez aux macro-catégories, vous ne serez pas en mesure de découvrir les micro-tendances et vous passerez à côté de nombreuses opportunités business.

– Baisse des revenus: De diverses manières, des données de mauvaise qualité peuvent entraîner une perte de revenus. Pensez aux produits qui ne sont pas vendus parce que les données produit sous-jacentes sont erronées ou incomplètes. Un ciblage et des descriptions de produit approximatives sont particulièrement problématiques dans la vente retail ou chez les marketplaces.

Les données de bonne qualité sont une denrée précieuse et nécessaire pour tous vos cas d’usage : prévention des fraudes, le pilotage de performance, la gestion financière, ciblage marketing … Bien que la qualité des données soit vitale, elle est parfois négligée et ceci a un impact direct sur le business.

D’un côté, il y a des organisations qui gardent les données de produits partagées telles qu’elles sont récupérées depuis les fournisseurs. Cela entraîne une mauvaise qualité des données et des opportunités commerciales manquées en raison d’une analyse erronée/impossible. D’autre part, certaines organisations déploient beaucoup d’efforts pour homogénéiser ces données selon une norme unique et appropriée. Cependant, il s’agit d’un long processus manuel qui ralentit le go-to-market des produits et qui, la plupart du temps, est impossible à réaliser humainement.

AI to leverage your Product data quality_01

Problèmes de qualité des données produits‍

C’est pourquoi les techniques d’IA et de NLP ont été améliorées aujourd’hui pour aider à automatiser ce processus de normalisation et d’homogéinisation des données.

Qui est confronté à ce problème ?

Toute personne qui traite fréquemment une certaine volumétrie de données produit : les responsables de catégories produit, les acheteurs et les chefs de produits, suivis de data analysts, des spécialistes du marketing et de tous les postes liés à l’analyse ou à la création de données produits. La plupart de ces profils business n’ont souvent pas les compétences techniques avancées des data scientists. Lorsqu’ils reçoivent des données produit, ils peuvent être exposés à ces problèmes :
– Problème de matching de colonnes
– Valeurs au sein des informations produit erronées
– Informations manquantes dans les colonnes
– Conventions de nommage différentes. Par exemple, « Starbucks » peut s’écrire de 4 façons : starbucks, starb, starbx, strbx…
Données non structurées où les tâches pour y remédier sont très longues, répétitives et à faible valeur ajoutée, mais OBLIGATOIRES pour la qualité des données. Et toutes ces opérations ne sont encore possibles que pour de petites quantités de données.

‍‍

L’IA et le NLP au cœur du processus de qualité des données.‍

L’IA est souvent corrélée à l’utilisation de cas d’usage d’analyse poussée et de prédiction. Aujourd’hui, les approches de préparation des données basées sur l’IA sont rares. En dehors du changement automatique des formats de date et des formats de temps, l’IA reste très axée sur la création de modèles pour les cas d’usage eux-mêmes (clustering, analyse de cohortes, tarification dynamique, etc.) qui ont essentiellement besoin de données consistantes et propres.

Par conséquent, le NLP et l’IA sont également utilisés aujourd’hui pour automatiser la normalisation des données produit. Les nouvelles technologies ont permis, grâce au traitement du langage naturel qui traite les données textuelles d’améliorer la qualité des données produit. Les algorithmes mis à jour permettent désormais de comprendre les liens sémantiques entre les mots, le contexte et les séquences de mots.

Cependant, aujourd’hui, les personnes qui ont les compétences nécessaires pour utiliser correctement ces approches NLP et IA sont des personnes très techniques, contrairement aux experts produits.

Comme le volume des données sur les produits va devenir exponentiel, ce processus aujourd’hui manuel deviendra impossible. L’automatisation deviendra alors une nécessité par lesquelles toutes les entreprises doivent s’y atteler. Pour atteindre cet objectif, ils ont tendance à embaucher des profils techniques pour le faire en interne ou à l’externaliser, mais cela est très coûtant en termes de temps et d’argent.

Ainsi, chez YZR, nous avons fait de cette problématique notre mission principale. Nous avons donc travaillé sur la création d’un outil de données no-code pour automatiser le processus de normalisation des données textuelles (dont les données produit), en combinant IA et collaboration humaine. La plateforme divise par 10 le temps consacré à la normalisation de vos données produit mais les rend également fiables. Cela signifie des données produit plus précises, consistantes et enrichies, générées d’une manière très simple !

C’est pourquoi, sur la base de leurs propres témoignages, nos clients choisissent YZR pour :
– Corriger et normaliser les données sans effort grâce à notre technologie NLP.
– Ajouter des catégories personnalisées et extraire automatiquement les attributs importants
– Assurer une description propre des produits
– Accélérer le Go-to-market des produits
– Rendre les segmentations de produits plus fiables
– Permettre une analyse granulaire pour trouver de nouvelles opportunités business

Et cela est devenu possible grâce à une collaboration main dans la main entre l’expertise humaine et les technologies NLP avancées.

AI to leverage your Product data quality

‍Collaboration humaine et IA chez YZR

Donc, pour tous ces cas d’usage et plus encore, n’hésitez pas à nous contacter pour plus d’informations. Nous serons très heureux de vous présenter notre outil de données no-code et, espérons-le, transformer ce pénible processus de normalisation en un jeu d’enfant.

Contenusliés