Nos travaux

L’activité du PEReN s’organise selon principalement trois modalités :

C’est dans ce cadre d’intervention que le PEReN élabore son programme de travail en étroite concertation avec les administrations partenaires et organise son activité en projets, selon un fonctionnement agile.

En 2022, le PEReN a mené 70 projets ayant contribué à :

Régulation de l’espace numérique

Enjeux de l’intégration des navigateurs internet dans le champ des obligations du DMA

Dans le cadre de la proposition législative européenne Digital Markets Act (DMA) analyse technique, pour le compte du ministère de l’Économie, des finances et de la souveraineté industrielle et numérique (MEFSIN), des conditions dans lesquelles les navigateurs internet peuvent être considérés comme des services de plateforme essentiel.

DMA & DSA, préconisations pour l’implémentation technique de dispositions

Appui technique des équipes du MEFSIN dans le cadre des négociations des projets de règlement européens Digital Markets Act (DMA) et Digital Services Act (DSA) en matière de périmètre d’application d’obligations (interopérabilité, self-preferencing, risk assessment) ou de métriques d’évaluation de leur respect par les opérateurs.

Déclinaison française de la régulation européenne de l’espace numérique

Dans le prolongement de l’adoption du DMA et du DSA, appui technique des services du ministère de l’Économie, des finances et de la souveraineté industrielle et numérique pour l’adaptation en droit français de cette réglementation européenne dans les champs notamment de la protection des mineurs et de la publicité en ligne.

Harmonisation européenne des règles concernant l’intelligence artificielle

Accompagnement technique des équipes du MEFSIN dans l’établissement de la position française sur le projet de règlement européen sur l’Intelligence artificielle.

Sécurisation de l’espace numérique

Lutte contre les contenus terroristes en ligne – Appel de Christchurch et GIFCT

Sur demande du ministère de l’Europe et des affaires étrangères, le PEReN a représenté les autorités françaises pour l’élaboration de la feuille de route de l’Appel de Christchurch sur l’évaluation des algorithmes. Il les représente également au sein du groupe de travail technique du Global Internet Forum to Counter Terrorism (GIFCT), pour lequel il a assuré le rôle de coordinateur des organisations gouvernementales.

Règlement européen de lutte contre les abus sexuels sur mineurs : appui technique

Dans le cadre de la proposition de règlement européen contre les abus sexuels sur mineurs, le PEReN fournit un appui technique aux services français en charge du suivi et de la négociation du règlement, tel que le Secrétariat général des affaires européennes. En 2022, il s’est intéressé notamment à la faisabilité et à la performance des solutions techniques nécessaires au respect des obligations de détection proposées par ce règlement, notamment concernant l’articulation entre obligation de détection et préservation du chiffrement.

Technologies d’identification des mineurs : état des pratiques

Dans le cadre d’une régulation en construction, production d’un panorama et d’une analyse d’efficacité des solutions techniques d’identification des utilisateurs mineurs actuellement mises en place par les plateformes pour adapter leur fonctionnement. Cette étude s’est intéressée également aux solutions alternatives possibles et aux initiatives européennes ou d’autres états membres.

Contrôle parental : modalités techniques de l’application de la loi Studer

Accompagnement technique, dès 2022, des services de la DGE dans la rédaction du décret d’application de la loi Studer visant à renforcer le contrôle parental sur les moyens d’accès à internet. Paru à l’été 2023, ce décret précise notamment les modalités de ce contrôle parental (accessibilité et fonctionnalités en particulier).

Amplification des contenus de presse

Sur sollicitation du ministère de la Culture, exploration des effets d’un algorithme de recommandation n’utilisant pas les données personnelles, en particulier concernant les bénéfices pour l’utilisateur quant à son exposition aux contenus préjudiciables, ainsi que les effets pour les éditeurs de presse induits par le changement de visibilité de leurs contenus.

Artificialité des contenus

À la demande de VIGINUM, conception d’une librairie capable de détecter les photos de profil de faux compte générées artificiellement (deepfakes) .

Évaluation de la prévalence de bots sur Twitter

Réalisation, en lien avec l’AMF et le ministère de l’Europe et des affaires étrangères, d’un prototype d’outil de détection de comptes automatiques (dits bots) reposant sur la stricte analyse des métadonnées des comptes et permettant ainsi de passer à l’échelle et d’avoir un indicateur n’ayant pas recours à des données personnelles.

Présence des vendeurs sur les marketplaces

Appui à la DGE pour l’analyse du fonctionnement algorithmique des marketplaces.

Influence des partenaires commerciaux sur les itinéraires de déplacement

Dans le prolongement de premiers développements initiés en 2021 pour l’ART, fourniture de briques techniques facilitant la comparaison des itinéraires proposés par différentes plateformes de mobilité en analysant les biais éventuels sur le calcul des temps de trajets.

Analyse des bannières de cookies

Développement pour les besoins de la CNIL d’un outil permettant de référencer les cookies stockés sur le navigateur d’un utilisateur avant et après son interaction avec des bannières de cookies.

Viralité de groupes de hashtags sur Twitter

Conception d’un tableau de bord opérationnel de suivi de groupes de hashtags sur la plateforme Twitter à usage de VIGINUM.

Détection de fausses écoutes (fake streams) en ligne

Accompagnement du CNM par la production d’une analyse de l'état de l‘art en matière de détection des fake streams (création artificielle de fausses écoutes de streaming) et du phénomène sur différentes plateformes.

Follow the money des sites gris

Mise à disposition de briques d’analyse des services utilisés par les sites internet impliqués dans la diffusion de contenus problématiques (portant par exemple atteinte à la propriété intellectuelle). L’objectif est d’identifier les acteurs participant le plus au financement et au fonctionnement de ces sites (régies publicitaires et annonceurs, programmes d’affiliation, services de mesure d’audience et de traçabilité, systèmes de paiement en ligne, etc.).

Rapports des plateformes sur la modération des contenus

Accompagnement de l’Arcom dans la conception des rapports de transparence demandés aux plateformes relatifs à la modération des contenus par leurs services, l’étude des algorithmes de modération et la définition du suivi d’indicateurs publiés.

Détection automatique de pratiques commerciales trompeuses

Appui à la DGCCRF dans la détection automatique de pratiques commerciales trompeuses via le développement d’un outil dédié à partir de cas d’usage.

Obligation de portabilité : identification de l’exhaustivité des données personnelles téléchargeables

En lien avec la CNIL, étude comparative entre les données collectées par les plateformes et celles effectivement retournées à l’utilisateur au titre de l’exercice de son droit à la portabilité ou de son droit d’accès.

Consommation de bande passante des services de média à la demande sur différents terminaux

En lien avec la DGE, réalisation d’une étude sur l’adaptation de la qualité du flux vidéo et de sa consommation en bande passante selon le terminal de l’utilisateur pour des plateformes de média à la demande.

Valeur du consentement

Appui à la CNIL pour réaliser une analyse exploratoire de l'impact du parcours web d’un utilisateur sur le niveau des enchères publicitaires menées par les annonceurs pour afficher leur publicité.

Partitionnement automatisé de données (clustering)

Conception et déploiement d’une interface de programmation applicative en ligne (API web) permettant aux partenaires du PEReN et à son équipe d’accomplir des tâches de clustering, ou partitionnement de données, de manière simplifiée, c’est à dire sans nécessiter la mise en œuvre d’un entraînement coûteux et basé sur des techniques d’étiquetage.

Analyse de corpus textuels volumineux par traitement automatisé du langage

Dans une logique de mutualisation, mise à disposition de tous les partenaires du PEReN, et de son équipe, d’une interface de programmation applicative en ligne (API web) offrant des fonctionnalités d’analyse de texte (détection de ngrams, d’entités nommées ou de similarités entre unités textuelles).

Collecte automatisée de données publiquement accessibles (scraping)

Dans une logique de mutualisation, mise à disposition de tous les partenaires ayant des besoins de scraping, et justifiant des compétences juridiques requises, d’une interface de programmation en ligne (API web) de collecte automatisée de données publiquement accessibles.

Exploration des interfaces trompeuses ou Dark Patterns

Animation d’un groupe de travail destiné à faire un état des lieux des connaissances scientifiques mais aussi des textes réglementaires sur les Dark Patterns, assurer une veille documentaire sur le sujet et réfléchir aux approches techniques permettant de les analyser.

Projet Privacy Sandbox de Google

Animation d'un groupe de travail réunissant toutes les administrations intéressées (ministères de la Culture et de l’Économie, Autorité de la concurrence, CNIL, Arcom) et dédié à l’analyse technique mutualisée de la future Privacy Sandbox de Google et à une veille sur le sujet.

Qualité de service des messageries OTT

A la demande de l’Arcep, conception d’une interface applicative permettant d’automatiser des tests qualité sur des services de messageries instantanées OTT (Over The Top ou par contournement) sous différentes conditions d’utilisation réalistes de l’appareil (géolocalisation, batterie, qualité du réseau…) (code open source de l’outil : https://code.peren.fr/peren/2022-qualit-de-service-des-messageries-ott/qualott ).

Applications mobiles : identification des données personnelles transmises

En appui à la CNIL, développement d’un outil facilitant l’identification des accès par des applications mobiles à des données personnelles, avec ou sans consentement préalable.

Suivi automatique des rapports environnementaux des plateformes

Sur demande de la DGE, mise en œuvre d’un outil de collecte automatique des rapports environnementaux dont la publication par les opérateurs de plateforme est une obligation réglementaire, en vue d’en exploiter le contenu pour réaliser des analyses comparatives et suivre leur évolution (code open source de l’outil : https://code.peren.fr/peren/2022-analyse-de-rapports ).

Cadre juridique du scraping, échanges sur les pratiques

Animation d’un groupe d’échanges autour des pratiques de collecte automatisées de données (scraping) mises en œuvre par les différentes organisations publiques et du suivi des évolutions techniques et juridiques en la matière afin de suggérer de potentielles évolutions du cadre législatif ou des pratiques.

Appui sur la recherche

Rencontres académiques autour des applications techniques du DSA

Organisation d’entretiens avec des représentants du monde de la recherche pour un état des lieux académique en matière d’audit algorithmique au regard des besoins techniques des régulateurs. Ces rencontres ont pour objectif de permettre la rédaction de lignes directrices pour les applications techniques du DSA.

Faisabilité des approches de l'Election Integrity Partnership

Initiative du Stanford Internet Observatory et de l’Université de Washington, l’Election Integrity Partnership vise à fournir aux académiques et à la société civile des outils et des méthodes d’évaluation de la prévalence de contenus nuisibles au processus démocratiques. Le PEReN a fourni un support technique à des chercheurs du centre GEODE pour évaluer la possibilité d’appliquer les mêmes méthodes au contexte français.

Détection et caractérisation de contenus viraux

Prolongement du projet lancé en 2021 à la demande du ministère de la Culture. En application de travaux académiques, il vise à développer une méthodologie de détection des contenus viraux susceptibles d’être problématiques en s’appuyant sur leurs propriétés de propagation et non sur une analyse directe du contenu ou des personnes impliquées. Focus 2022 : quantifier la notion de viralité à partir d’indicateurs statistiques en se concentrant sur les contenus à forte visibilité.

Anonymisation des données des travailleurs des plateformes

Initialisation des travaux pour l’élaboration d’un outil destiné aux travailleurs des plateformes leur permettant de visualiser les données qu’ils peuvent retrouver sur leur propre compte propre (par exercice du droit à la portabilité du RGPD) et de pouvoir les communiquer à des tiers agrégateurs après anonymisation.

Comparaison des algorithmes d‘autocomplétion

Sur la base d’une bibliographie académique, exploration du fonctionnement d’algorithmes d’autocomplétion (assistance à la saisie par suggestion de mots, phrases ou expressions) de plateformes numériques.

Création de personas pour l’API de scraping

Création de personas (profils web d’utilisateurs fictifs définis par un ensemble de cookies) afin d’étudier l’impact d’algorithmes ou de traitements différenciés sur le web en fonction de segments de profils utilisateurs. Ces outils constituent un développement d’intérêt académique qui a été présenté au colloque APVP (Atelier de Protection de la Vie Privée) en 2023.

Étude de la faisabilité de méthodes pour une analyse de contenus multimodaux

Exploration de techniques d’apprentissage faiblement supervisées permettant de traiter conjointement images et textes associés sur les plateformes numériques. L’étude préalable de l'état de l'art a permis notamment d’identifier les architectures à choisir.

Diffusion des savoirs

Séminaires académiques

Animation de rencontres trimestrielles ayant pour objectif de favoriser les échanges entre administrations en charge de la régulation des plateformes numériques et le monde de la recherche. Lors de ces rencontres, un chercheur ou un expert est invité à présenter ses travaux sur des thématiques en lien avec les activités du PEReN.

Collection «  Éclairages sur… 

Publications trimestrielles dans le cadre la collection «  Éclairage sur…  » qui propose, dans un esprit de vulgarisation, des éléments d’analyse techniques sur des thèmes liés à la régulation des plateformes numériques (numéros parus disponibles ici : https://www.peren.gouv.fr/publications/ ).

Ouverture de codes source

Publication en open source, dans un espace dédié (https://code.peren.fr/peren/), des codes de services applicatifs et outils mis en production.

Organisation d’un événement annuel grand public

Sous le haut patronage du Ministre délégué chargé de la Transition numérique et des Télécommunications, avec l’appui de la DGE et en partenariat avec Inria, le CNNum et Sciences Po Paris, organisation d’un événement grand public alliant conférences et hackathon pour mobiliser l’intelligence collective autour des enjeux liés à la régulation numérique.

Décryptage d’AMP, technologie Google d’optimisation d’affichage d’une page web

Étude visant à comprendre le fonctionnement détaillé de la technologie AMP de Google, d’analyser la pertinence des différents arguments avancés par Google (impact de la durée de chargement, mise en cache sur d'autres serveurs…) et d’évaluer de potentielles alternatives à cette technologie (étude disponible ici : https://www.peren.gouv.fr/actualites/2022-10-17_eclairage_sur_amp/ ).

Traitement automatique des rapports de transparence

Réalisation d’un outil de visualisation des rapports de transparence que les opérateurs de plateforme ont l’obligation de publier et de mise en forme dans un format facilement exploitable manuellement ou automatiquement.

Impact des algorithmes sur la requalification des travailleurs

Identification et analyse des jurisprudences et textes légaux (en vigueur et en discussion) portant sur les algorithmes des plateformes numériques de travail afin de mieux comprendre les exigences légales et les moyens utilisés pour caractériser ces algorithmes et leur impact. Promotion de cette expertise à la fois auprès de chercheurs et autorités de régulation.

La loi du 25 octobre 2021, relative à la régulation et à la protection de l’accès aux œuvres culturelles à l’ère numérique, a doté le PEReN du pouvoir d’expérimentation. En 2022, première année de mise en œuvre de cette nouvelle compétence, cinq projets ont été menés.
Suivi des prix et délais de livraison pratiqués par les places de marché

Étude des possibilités de suivi historisé des évolutions de prix et délais de livraison sur les sites de e-commerce afin de vérifier que les informations disponibles publiquement et pouvant être collectées sont suffisantes pour permettre des analyses par les services compétents ou, dans un second temps, l’élaboration d’algorithmes de détection de mauvaises pratiques. L’expérimentation a permis de valider la mise au point d’un outil de suivi qui pourra être utilisé par des administrations intéressées.

Création de profils de test

Génération de profils d’utilisateurs types, définis par un historique de navigation (cookies), dans le but d’étudier l’impact de la personnalisation sur les résultats fournis par les algorithmes ou les interfaces d’une plateforme. Cette expérimentation a confirmé la possibilité de créer des profils personnalisés exploitables pour l’étude du fonctionnement d’algorithmes de recommandation. Toutefois, la mutualisation de ces profils types reste limitée en raison du code informatique requis très dépendant de la plateforme potentiellement étudiée. Sans rechercher un outil universel, des outils spécifiques reposant sur cette expérimentation pourront être développés au cas par cas.

Convergence algorithmique des contenus

Étude de la faisabilité d’un outil capable de réaliser automatiquement un parcours utilisateur sur une plateforme en ligne de vidéos à la demande selon des préférences déterminées, sans stockage des vidéos ni analyse de leur contenu mais uniquement en utilisant la description textuelle qui en est faite. Un tel outil permettrait d’étudier les algorithmes de recommandation, notamment s’agissant des bulles de filtre (enfermement informationnel). Si l’expérimentation a permis d’élaborer un outil de collecte sur applications mobiles, elle a confirmé que les seules descriptions des vidéos n’étaient pas suffisantes pour une analyse du phénomène de bulle de filtre. L’analyse du contenu de la vidéo et de la bande son d’accompagnement sont apparues nécessaires.

Audit algorithmique en boîte noire

Développement de méthodes d’évaluation des principaux paramètres algorithmiques d’une plateforme, en testant directement son interface publique, c’est-à-dire sans nécessiter sa coopération active. Cette expérimentation a permis de développer des stratégies d’optimisation pour adapter automatiquement les échantillons demandés et ainsi minimiser le volume de requêtes nécessaires. Elle a ainsi permis de développer des briques logicielles d’audit algorithmique pouvant s’adapter à des stratégies de tarification dynamique ou surge pricing (tarification incitative). L’évaluation des principaux paramètres algorithmiques en boîte noire pourrait ainsi permettre de confronter les obligations de transparence consacrées par le règlement européen P2B à l’expérience.

Analyse du type de réseau routier proposé aux automobilistes par les calculateurs d’itinéraires

Aux fins d’évaluation de mise en œuvre des obligations de la loi Climat et Résilience, développement de briques logicielles nécessaires à la collecte automatique des itinéraires proposés par des calculateurs d’itinéraires, au rapprochement des ces itinéraires avec les bases de données géographiques nationales du réseau routier et à la catégorisation automatique des axes empruntés en tant que partie du réseau routier principal ou secondaire. Le dernier objectif de cette expérimentation, à savoir le développement de briques d’analyse de la conformité des itinéraires proposés aux obligations des plateformes, a été limité au vu du faible volume de données disponibles.


Télécharger le rapport d'activité 2022 du PEReN