Duplicate Content sur Shopify : identifier les vrais problèmes et les régler

Shopify génère du duplicate content. C'est un fait. Ce qui l'est moins, c'est de savoir lequel de ces doublons te coûte réellement des positions dans Google, et lequel tu peux ignorer sans perdre de nuit de sommeil.

La majorité des articles sur le sujet te font peur inutilement. Ils listent chaque URL dupliquée comme si c'était une bombe à désamorcer. Résultat : tu passes des heures sur des faux problèmes pendant que les vrais doublons continuent de cannibiliser tes pages produits.

Ce guide va dans l'autre sens. On identifie ce qui compte, on ignore ce qui ne compte pas, et on corrige proprement sans tout casser.

Ce qu'est vraiment le duplicate content (et ce qu'il n'est pas)

Le duplicate content, c'est quand deux URLs différentes servent un contenu identique ou quasi-identique à Google. Le moteur se retrouve face à un choix : quelle version indexer ? Quelle version classer ? Dans le doute, il peut décider de ne classer aucune des deux correctement.

Ce que ce n'est pas : une catastrophe automatique. Google gère le duplicate interne mieux qu'avant. Il applique ses propres heuristiques pour choisir l'URL canonique. Le problème, c'est quand sa sélection diffère de la tienne, et que la mauvaise URL passe devant la bonne dans l'index.

Les 3 types de duplicate qui existent sur Shopify

Sur une boutique Shopify, les doublons se répartissent en trois catégories distinctes :

Duplicate structural : généré par l'architecture de Shopify elle-même (URLs de produits accessibles via plusieurs collections)
Duplicate paramétrique : créé par les filtres, les tris, les UTM qui ajoutent des paramètres à l'URL de base
Duplicate éditorial : du contenu que tu as copié-collé toi-même, descriptions produits identiques entre références similaires, pages catégories avec texte générique

Chaque type demande une approche différente. Le structural se règle avec des canonicals. Le paramétrique avec la Search Console et robots.txt. L'éditorial, seul toi peux le corriger en réécrivant.

Pourquoi Shopify en génère automatiquement

Shopify utilise une architecture de collections qui crée par construction deux URLs valides pour chaque produit appartenant à une collection :

/products/mon-produit (URL canonique)
/collections/ma-collection/products/mon-produit (URL de collection)

Shopify injecte un canonical tag sur l'URL de collection qui pointe vers /products/mon-produit. En théorie, le problème est réglé. En pratique, ça dépend de ta configuration de thème et de tes apps. Si une app de filtres ou un thème mal codé écrase ces canonicals, les doublons structuraux redeviennent un vrai problème.

Où Google voit du duplicate sur ta boutique Shopify

Théorie mise à part, voilà les endroits concrets où les doublons se forment dans la vraie vie d'une boutique Shopify.

Les paramètres UTM qui créent des doublons invisibles

Tu lances une campagne email. Ton lien ressemble à : /products/mon-produit?utm_source=klaviyo&utm_medium=email&utm_campaign=soldes. Google crawle ce lien. Il voit une URL différente de /products/mon-produit. Si aucune règle de gestion des paramètres n'est en place, il peut décider d'indexer cette URL avec ses paramètres.

Résultat : tu as potentiellement des dizaines de versions de la même page produit dans l'index, une par campagne marketing que tu as lancée. Ce n'est pas le duplicate le plus dangereux, mais ça dilue le PageRank et ça gonfle artificiellement ton index d'URLs sans valeur.

Les variantes produits mal configurées

C'est là que ça devient sérieux. Sur Shopify, certains thèmes ou apps de filtrage créent des URLs distinctes pour chaque variante produit : couleur, taille, matière. Exemple :

/products/t-shirt-blanc?variant=123456
/products/t-shirt-blanc?variant=789012
/products/t-shirt-blanc?variant=345678

Si ces URLs sont indexables et ne pointent pas toutes vers l'URL principale du produit, tu as un problème réel. Google peut choisir d'indexer la variante "taille M blanc" plutôt que la page principale, qui est pourtant celle qui cible ton mot-clé principal.

Collections et collections filtrées

Les apps de filtrage (Boost Commerce, Infinite Options, etc.) génèrent des URLs paramétrées pour chaque combinaison de filtres appliqués par tes visiteurs :

/collections/robes?filter.p.m.couleur=rouge&filter.p.m.taille=38

Chaque combinaison est une nouvelle URL potentiellement crawlable. Sur une collection de 200 produits avec 5 attributs de filtrage, le nombre théorique d'URLs dupliquées se chiffre en milliers.

+300%

d'URLs crawlées en moyenne sur une boutique avec filtres non gérés

~40%

du budget crawl gaspillé sur des pages dupliquées ou sans valeur SEO

2 à 6

URLs générées par produit Shopify selon la configuration

Quel duplicate content tue vraiment ton ranking

Tout n'est pas égal. Il y a des doublons qui te coûtent des positions et des doublons que Google gère seul sans que tu aies à intervenir.

Les doublons qui impactent ta visibilité

Trois situations méritent une action immédiate :

Les pages variantes indexées séparément sans canonical vers le produit principal. Google répartit l'autorité entre plusieurs URLs au lieu de la concentrer sur une seule.
Les descriptions produits identiques entre plusieurs références. Si tu vends 10 coloris du même sac avec la même description, Google a du mal à différencier la valeur de chaque page.
Les pages de collection filtrées indexables qui cannibalisent ta page collection principale sur des mots-clés de tête.

Les faux positifs que tu peux ignorer

Ces doublons existent techniquement mais ne nécessitent aucune action urgente de ta part :

Les URLs /collections/X/products/Y gérées par les canonicals natifs Shopify (si ton thème ne les écrase pas)
Les paramètres UTM si tu as configuré la Search Console pour les ignorer
Les pages de pagination (?page=2) sur tes collections, qui ne ciblent pas de mots-clés distincts

Comment détecter le duplicate content sur Shopify

Pas besoin de 12 outils. L'essentiel se fait avec Google Search Console et un peu de méthode.

Audit manuel rapide avec Google Search Console

Voilà la séquence en 4 étapes :

Rapport de couverture d'index → vérifie le nombre d'URLs indexées. Si tu as 500 produits et 3000 URLs indexées, il y a clairement un problème.
Inspection d'URL → prends une URL de produit en version collection (/collections/X/products/Y) et vérifie si Google reconnaît le canonical ou s'il considère cette URL comme la version choisie.
Rapport sur les performances → filtre par page et cherche si plusieurs URLs différentes rankent sur le même mot-clé. C'est un signal direct de cannibalisation par duplicate.
Paramètres d'URL (ancien outil Search Console) → si tu es encore sur l'ancienne interface ou via les paramètres dans les propriétés, tu peux voir quels paramètres Google a détectés.

Les signaux à surveiller

Au-delà des outils, ces signaux dans tes données indiquent un problème de duplicate actif :

Chute de trafic organique sur une page produit spécifique sans changement de contenu de ta part
Deux URLs de ta boutique qui se battent pour le même mot-clé dans les SERP
Google qui indexe une URL de collection à la place de l'URL produit que tu voulais positionner
Nombre de pages indexées qui croît beaucoup plus vite que ton catalogue réel

Solutions concrètes pour Shopify (sans tout casser)

On va du plus simple au plus technique. Commence par le haut de cette liste.

Configurer les canonical tags correctement

C'est la priorité numéro un. Vérifie que ton thème Shopify injecte bien les canonical tags sur chaque page produit et chaque page de collection. Dans le code Liquid de ton thème, la balise doit ressembler à :

<link rel="canonical" href="{{ canonical_url }}">

Shopify génère automatiquement la variable canonical_url correcte, à condition que personne n'ait modifié ce comportement. Si une app de filtres ou un thème customisé génère ses propres canonical, c'est là que ça déraille. Vérifie en inspectant le code source de tes pages produits accessibles via une URL de collection.

Utiliser robots.txt et disallow

Pour les pages qui ne doivent pas être crawlées du tout (filtres, tris, pagination profonde), le fichier robots.txt est ton allié. Depuis Shopify 2.0, tu peux éditer ce fichier directement depuis l'admin.

Des règles utiles à ajouter :

Disallow: /collections/*?sort_by=, bloque le crawl des URLs de tri
Disallow: /collections/*+, bloque les collections combinées automatiques
Disallow: /search?, bloque les pages de résultats de recherche interne

Attention : disallow dans robots.txt empêche le crawl, pas l'indexation. Si des liens externes pointent vers ces URLs, Google peut quand même les indexer sans les crawler. Pour une exclusion propre, couple robots.txt avec une balise noindex ou un canonical.

Gérer les paramètres UTM

Sans gestion des paramètres UTM

Chaque campagne email ou pub crée une nouvelle URL indexable. Google crawle /products/sac?utm_source=klaviyo&utm_campaign=black-friday comme une page distincte. Sur 50 campagnes annuelles, tu peux avoir 50 versions indexées du même produit. Le budget crawl part en fumée sur des URLs sans valeur.

Avec gestion correcte des UTM

Dans Google Search Console → Ancienne version → Paramètres d'URL, tu déclares les paramètres UTM comme "ne change pas le contenu de la page". Google les ignore à l'indexation. Toute l'autorité reste concentrée sur l'URL propre. Zéro doublon, zéro perte de budget crawl.

Type de duplicate	Impact SEO réel	Solution	Urgence
Variantes produits indexées séparément	Élevé, dilution d'autorité	Canonical vers URL produit principale	Haute
Collections filtrées crawlables	Élevé, cannibalisation	Robots.txt + noindex sur filtres	Haute
Descriptions produits identiques	Moyen, différenciation faible	Réécriture éditoriale	Moyenne
URLs /collections/X/products/Y	Faible si canonical natif actif	Vérification canonical Shopify	Faible
Paramètres UTM	Faible à moyen	Configuration Search Console	Faible
Pages de pagination	Très faible	Aucune action requise	Nulle

Quand appeler un vrai audit SEO pour Shopify

Il y a des cas où faire ça seul risque de te coûter plus cher que ça ne te rapporte. Voilà les signaux qui indiquent qu'il est temps de passer à autre chose :

Ton catalogue dépasse 500 références avec des variants multiples et plusieurs collections croisées
Tu as migré vers Shopify depuis une autre plateforme et le duplicate vient d'anciennes URLs encore dans l'index
Tu utilises plusieurs apps de filtrage, de merchandising et de traduction, les interactions entre elles sur les canonicals sont imprévisibles
Ton trafic organique a chuté significativement sans changement de contenu identifiable de ta part
Tu prépares une revente de ta boutique et tu veux que le SEO soit propre pour maximiser la valeur

Dans ces situations, un audit personnalisé pour identifier exactement d'où viennent les doublons évite les erreurs de manipulation qui peuvent empirer la situation. On parle de configurations de canonical qui entrent en conflit, de suppressions d'URLs qui cassent des liens entrants qui comptent, ou de disallow trop agressifs qui cachent du contenu utile à Google.

Si tu travailles sur du long terme avec un catalogue qui évolue constamment, le programme d'accompagnement e-commerce qui traite ces problèmes systématiquement est plus adapté qu'une correction one-shot. Les doublons reviennent dès qu'on ajoute de nouveaux produits ou collections sans process en place.

Le duplicate content sur Shopify n'est pas un problème à résoudre une fois. C'est une hygiène à maintenir à chaque mise à jour du catalogue, chaque nouvelle app installée, chaque campagne marketing lancée.

Foire aux questions

Questions fréquentes

Pourquoi Shopify crée-t-il automatiquement du duplicate content ?

L'architecture de Shopify permet à un produit d'appartenir à plusieurs collections simultanément. Chaque collection génère sa propre URL pour ce produit (/collections/X/products/mon-produit) en plus de l'URL principale (/products/mon-produit). Shopify tente de corriger ça avec des canonical tags automatiques, mais certains thèmes ou apps peuvent interférer avec ce mécanisme. C'est structurel à la plateforme, pas une erreur de configuration de ta part.

Le duplicate content tue-t-il vraiment mon SEO ou c'est exagéré ?

Ça dépend du type de duplicate. Les doublons bien gérés par les canonicals natifs de Shopify ont un impact négligeable. En revanche, les variantes produits indexées séparément, les pages de filtres crawlables et les descriptions copiées-collées entre produits similaires ont un vrai impact sur la capacité de Google à attribuer la bonne autorité à la bonne page. Le sujet est souvent surestimé pour des doublons mineurs et sous-estimé pour les doublons structuraux sur des pages à fort potentiel commercial.

Comment savoir s'il y a du duplicate content sur ma boutique Shopify ?

Commence par Google Search Console : compare le nombre d'URLs indexées avec le nombre réel de pages de ton catalogue. Un écart important est un signal d'alerte. Ensuite, utilise le rapport de couverture pour détecter les URLs "indexées sans envoi de sitemap", souvent des doublons que Google a trouvés seul. Pour aller plus loin, un outil comme Screaming Frog crawle ta boutique et identifie les pages avec un contenu identique ou très proche.

Comment corriger le duplicate content sans modifier mes URLs existantes ?

La réponse principale, c'est les canonical tags. Tu n'as pas besoin de supprimer ou rediriger les URLs dupliquées, tu indiques simplement à Google quelle version est la référence. Pour les paramètres de filtres et de tri, robots.txt et la configuration des paramètres dans Search Console permettent de gérer le problème sans toucher à une seule URL. Les redirections 301 ne sont utiles que si tu veux vraiment consolider des URLs qui avaient leur propre historique de liens entrants.

Les paramètres UTM créent-ils du duplicate content problématique ?

Oui et non. Les UTM créent techniquement des doublons, mais leur impact dépend de si Google les crawle et les indexe. Si tes liens UTM sont en no-follow ou que Google ne les découvre que via des emails (non crawlés), le risque est faible. Le vrai problème arrive quand ces URLs se retrouvent sur des pages web indexées ou dans des sitemaps par erreur. La correction est simple : déclarer ces paramètres dans Google Search Console comme paramètres qui ne modifient pas le contenu.

Faut-il bloquer toutes les pages de collection filtrées dans robots.txt ?

Non, pas toutes. Certaines combinaisons de filtres correspondent à des intentions de recherche réelles avec du volume, par exemple, une page "robes rouges" peut mériter d'être indexée si tu as suffisamment de produits pour justifier une page de qualité. La règle : bloque les combinaisons de filtres qui génèrent des pages vides ou quasi-vides, et les paramètres purement techniques (tri, pagination profonde). Laisse indexables les pages de filtres qui ont un vrai volume de recherche associé et suffisamment de produits pour offrir une expérience utilisateur correcte.

Ce qu'il faut retenir et par où commencer

Le duplicate content sur Shopify n'est pas le monstre que certains outils d'audit te montrent. Mais ce n'est pas non plus quelque chose à ignorer. La ligne de partage est simple : est-ce que ce doublon empêche Google d'attribuer l'autorité à la bonne URL sur une page qui compte pour ton business ?

Si oui, corrige. Canonical tags d'abord, robots.txt ensuite, contenu éditorial après. Dans cet ordre, avec cette priorité.

Si non, passe au sujet suivant. Il y a des leviers SEO qui rapportent bien plus que de chasser des doublons fantômes.

Tu as des doublons mais tu sais pas par où commencer ? Réserve un audit d'une heure avec Peii pour voir exactement ce qui plombe ton SEO et le plan pour corriger. Pas de rapport générique, pas de liste de 200 points sans priorité, une analyse de ce qui compte sur ta boutique, dans l'ordre où ça compte. Tu repars avec un plan d'action clair, pas un autre outil à interpréter seul.