Introduction à la proxification

👋
La proxification est un mécanisme permettant d’altérer les données généralement pour les rendre conformes à la réglementation en vigueur. Nous aborderons ici le cas de Google Analytics et de la mise en conformité en fonction des directives de la CNIL. Enfin nous apporterons nos interprétations et convictions sur ces directives.

Rappel sur la problématique

L'utilisation de Google Analytics est soumise à deux contraintes juridiques en raison de la directive ePrivacy et par extension à la RGPD: le consentement des cookies et traceurs, ainsi que le transfert illégal de données personnelles vers les États-Unis.
⚖️
En savoir plus sur la réglementation : Google Analytics est-il légal en Europe ?Google Analytics est-il légal en Europe ?

La proposition de la CNIL : la proxyfication

En juin 2022, la CNIL a recommandé l'utilisation de la “proxyfication” et de mesures spécifiques à mettre en place pour pouvoir continuer à utiliser GA4, en conformité avec les directives Européennes et la RGPD :
Google Analytics et transferts de données : comment mettre son outil de mesure d'audience en conformité avec le RGPD ?
La Cour de justice de l'Union européenne (CJUE), dans son arrêt du 16 juillet 2020, a invalidé le Privacy Shield, dispositif qui permettait un encadrement des transferts de données personnelles entre l'Union européenne et les États-Unis. La législation états-unienne n'offre, en effet, pas de garanties suffisantes face au risque d'accès par les autorités, notamment les services de renseignement, aux données personnelles de résidents européens.
Google Analytics et transferts de données : comment mettre son outil de mesure d'audience en conformité avec le RGPD ?
La proxyfication de Google Analytics consiste principalement à remplacer certaines informations par le serveur de proxification pouvant participer à la génération d'une empreinte, et supprimer toute autre donnée pouvant mener à une réidentification comme ID de base CRM :
  1. Ne pas transférer l'adresse IP vers les serveurs de l'outil de mesure.
  1. Remplacer l'identifiant utilisateur par le serveur de proxyfication.
  1. Supprimer les informations de site référent externes au site ainsi que les paramètres contenus dans les URL collectées.
  1. Retraiter les informations pouvant participer à la génération d'une empreinte
  1. Ne collecter aucun identifiant de cross-domain tracking ou déterministe.
  1. Supprimer toute autre donnée pouvant mener à une réidentification.
⚠️
Appliquer une proxyfication strictement selon les recommandations de la CNIL peut rendre presque caduc votre outil d’analyse.
Mais heureusement certaines de ces contraintes juridiques sont discutables ou solvables par des manipulations techniques.

Les critères pour une proxyfication conforme

La CNIL a présenté plusieurs mesures qu'elle juge nécessaires pour que le processus soit conforme au RGPD. Nous allons les lister ici avec les conséquences, ainsi que nos recommandations.

Ne pas transférer l'adresse IP vers les serveurs de l'outil de mesure.

Il s’agit d’anonymiser les adresses IP. Anonymiser seulement les 3 derniers caractères suffit. Cela permettra quand même de déduire la région en termes de précision.
⚠️
Google Analytics ne pourra pas déduire la provenance des utilisateurs au niveau de la ville. En fonction des cas cela peut être un problème pour certaines activités.
💡
Configurez le proxy de sorte qu’il puisse lui-même déduire de l’adresse IP la géolocalisation de vos visiteurs et la transmettre sans envoyer son IP.

Remplacer l'identifiant utilisateur par le serveur de proxyfication.

La CNIL estime que Google ne fournit pas de preuve ou de garanties suffisante qu'il ne recoupe pas ces données avec d'autres données tierces. C’est ce flou qui pose problème à la CNIL.
💡
Ajouter une clé de chiffrement avant envoi de l’ID par le serveur de proxyfication.

Supprimer les informations de site référent (ou "referrer") externes au site ainsi que les paramètres contenus dans les URL collectées.

Plutôt que de limiter le “referrer” au nom de domaine, la CNIL demande de supprimer le nom du “referrer”. Il en est de même des paramètres UTM des campagnes (source, medium, campaign, etc.).
⚠️
Incapacité à collecter la provenance des utilisateurs. C’est une véritable problématique pour la majorité des acteurs.
💡
Conservez quand même le nom de domaine du “referrer” ainsi que les paramètres UTM qui ne permettent pas une identification.
D’ailleurs, beaucoup de solutions analytics recommandées par la CNIL ont non seulement accès à des éléments d’informations issus du “referrer”, mais également sans besoin d’obtenir le consentement des utilisateurs !
Attention si vous ne pouvez pas passer le gclid, vous devrez tagger vos campagnes Google Ads avec des UTMs puisque l’auto-tagging ne sera plus possible.

Retraiter les informations pouvant participer à la génération d'une empreinte (ou "fingerprint"), telles que les "user-agents".

Il faudra supprimer les informations inutiles du User Agent.
⚠️
L’impact restera limité (ex : modèle précis de téléphone ou version de navigateur)

Ne collecter aucun identifiant de cross-domain tracking ou déterministe (CRM, id unique).

⚠️
Perte de l’origine des visites et incapacité à enrichir et recouper vos données pour suivre l’utilisateur sur plusieurs domaines ou faire certaines analyses.
👉
Ajoutez une clé de chiffrement avant envoi de l’ID par le serveur de proxyfication.
💡
Dès lors que le consentement de l’utilisateur est donné et que les ID sont chiffrées, donc qu’elles ne peuvent pas être utilisées par Google pour d’autres croisements de données, nous pensons qu’il n’est pas nécessaire d’empêcher le cross-domain tracking.

Supprimer toute autre donnée pouvant mener à une réidentification.

Des recommandations ont également été émises sur les conditions d'hébergement du proxy 🇪🇺. Vous pouvez aussi mettre en place la pour vous sécuriser encore d’avantage.

Notre avis sur la proxyfication de Google Analytics

Dans tous les cas il faudra s’assurer du respect du consentement de l’utilisateur.
Ensuite il peut être utile de prendre certaines libertés tant que vous pouvez le justifier et le documenter pour montrer que vous répondez parfaitement aux attentes de la CNIL. La proxyfication oui, mais pas au sens strict de la CNIL, sinon votre outil n’est quasiment pas exploitable.
Enfin, la proxification qui est de la collecte de donnée en server-side est également une bonne pratique pour maîtriser ce qui est envoyé aux partenaires de façon générale (voir : ITP/ETP Safari, iOS14 et le server-sideITP/ETP Safari, iOS14 et le server-side).

En savoir plus


✍️
Auteur
Image without caption

Edouard de Joussineau

Dirigeant de Starfox Analytics. 9 ans dans le CRO & la Web Analyse. Entrepreneur et Product Manager mais également amateur de bon vin, de F1 et d’échecs.
Suivez Starfox Analytics sur Linkedin
Un besoin, une question ? Notre équipe vous répondra au plus vite.
→ Suivez Starfox sur Linkedin
Suivez Starfox Analytics sur Linkedin Un besoin, une question ? Notre équipe vous répondra au plus vite. Suivez Starfox sur Linkedin
👉
Contactez-nous ! Un besoin, une question ? Écrivez-nous à [email protected]. Notre équipe vous répondra au plus vite. Prendre rendez-vous

Autres ressources


GA4 vs RGPD de la CNIL : utilisation légale impossible ?
Google Analytics est-il illégal au regard des normes RGPD ? Voici comment utiliser GA4 conformément aux recommandations de la CNIL !
GA4 vs RGPD de la CNIL : utilisation légale impossible ?