Nos travaux
L’activité du PEReN s’organise selon principalement trois modalités :
- le partenariat, au travers de conventions avec les services de l’État ou les autorités indépendantes intervenant dans la régulation des plateformes numériques ;
- l’expérimentation, pour construire de sa propre initiative des prototypes d’outils de régulation ;
- le travail de recherche, visant à conduire seul ou en partenariat des travaux de recherche publique au sens de l’article L. 112-1 du code de la recherche.
C’est dans ce cadre d’intervention que le PEReN élabore son programme de travail en étroite concertation avec les administrations partenaires et organise son activité en projets, selon un fonctionnement agile.
En 2022, le PEReN a mené 70 projets ayant contribué à :
- accompagner la préparation et la négociation des textes de réglementation ;
- développer des outils de régulation et d’évaluation ;
- mettre en place des ressources mutualisées ;
- nourrir l’état de l’art et diffuser les savoirs.
Régulation de l’espace numérique
Enjeux de l’intégration des navigateurs internet dans le champ des obligations du DMA
Dans le cadre de la proposition législative européenne Digital Markets Act (DMA) analyse technique, pour le compte du ministère de l’Économie, des finances et de la souveraineté industrielle et numérique (MEFSIN), des conditions dans lesquelles les navigateurs internet peuvent être considérés comme des services de plateforme essentiel.
DMA & DSA, préconisations pour l’implémentation technique de dispositions
Appui technique des équipes du MEFSIN dans le cadre des négociations des projets de règlement européens Digital Markets Act (DMA) et Digital Services Act (DSA) en matière de périmètre d’application d’obligations (interopérabilité, self-preferencing, risk assessment) ou de métriques d’évaluation de leur respect par les opérateurs.
Déclinaison française de la régulation européenne de l’espace numérique
Dans le prolongement de l’adoption du DMA et du DSA, appui technique des services du ministère de l’Économie, des finances et de la souveraineté industrielle et numérique pour l’adaptation en droit français de cette réglementation européenne dans les champs notamment de la protection des mineurs et de la publicité en ligne.
Harmonisation européenne des règles concernant l’intelligence artificielle
Accompagnement technique des équipes du MEFSIN dans l’établissement de la position française sur le projet de règlement européen sur l’Intelligence artificielle.
Sécurisation de l’espace numérique
Lutte contre les contenus terroristes en ligne – Appel de Christchurch et GIFCT
Sur demande du ministère de l’Europe et des affaires étrangères, le PEReN a représenté les autorités françaises pour l’élaboration de la feuille de route de l’Appel de Christchurch sur l’évaluation des algorithmes. Il les représente également au sein du groupe de travail technique du Global Internet Forum to Counter Terrorism (GIFCT), pour lequel il a assuré le rôle de coordinateur des organisations gouvernementales.
Règlement européen de lutte contre les abus sexuels sur mineurs : appui technique
Dans le cadre de la proposition de règlement européen contre les abus sexuels sur mineurs, le PEReN fournit un appui technique aux services français en charge du suivi et de la négociation du règlement, tel que le Secrétariat général des affaires européennes. En 2022, il s’est intéressé notamment à la faisabilité et à la performance des solutions techniques nécessaires au respect des obligations de détection proposées par ce règlement, notamment concernant l’articulation entre obligation de détection et préservation du chiffrement.
Technologies d’identification des mineurs : état des pratiques
Dans le cadre d’une régulation en construction, production d’un panorama et d’une analyse d’efficacité des solutions techniques d’identification des utilisateurs mineurs actuellement mises en place par les plateformes pour adapter leur fonctionnement. Cette étude s’est intéressée également aux solutions alternatives possibles et aux initiatives européennes ou d’autres états membres.
Contrôle parental : modalités techniques de l’application de la loi Studer
Accompagnement technique, dès 2022, des services de la DGE dans la rédaction du décret d’application de la loi Studer visant à renforcer le contrôle parental sur les moyens d’accès à internet. Paru à l’été 2023, ce décret précise notamment les modalités de ce contrôle parental (accessibilité et fonctionnalités en particulier).
Amplification des contenus de presse
Sur sollicitation du ministère de la Culture, exploration des effets d’un algorithme de recommandation n’utilisant pas les données personnelles, en particulier concernant les bénéfices pour l’utilisateur quant à son exposition aux contenus préjudiciables, ainsi que les effets pour les éditeurs de presse induits par le changement de visibilité de leurs contenus.
Artificialité des contenus
À la demande de VIGINUM, conception d’une librairie capable de détecter les photos de profil de faux compte générées artificiellement (deepfakes) .
Évaluation de la prévalence de bots sur Twitter
Réalisation, en lien avec l’AMF et le ministère de l’Europe et des affaires étrangères, d’un prototype d’outil de détection de comptes automatiques (dits bots) reposant sur la stricte analyse des métadonnées des comptes et permettant ainsi de passer à l’échelle et d’avoir un indicateur n’ayant pas recours à des données personnelles.
Présence des vendeurs sur les marketplaces
Appui à la DGE pour l’analyse du fonctionnement algorithmique des marketplaces.
Influence des partenaires commerciaux sur les itinéraires de déplacement
Dans le prolongement de premiers développements initiés en 2021 pour l’ART, fourniture de briques techniques facilitant la comparaison des itinéraires proposés par différentes plateformes de mobilité en analysant les biais éventuels sur le calcul des temps de trajets.
Analyse des bannières de cookies
Développement pour les besoins de la CNIL d’un outil permettant de référencer les cookies stockés sur le navigateur d’un utilisateur avant et après son interaction avec des bannières de cookies.
Viralité de groupes de hashtags sur Twitter
Conception d’un tableau de bord opérationnel de suivi de groupes de hashtags sur la plateforme Twitter à usage de VIGINUM.
Détection de fausses écoutes (fake streams) en ligne
Accompagnement du CNM par la production d’une analyse de l'état de l‘art en matière de détection des fake streams (création artificielle de fausses écoutes de streaming) et du phénomène sur différentes plateformes.
Follow the money des sites gris
Mise à disposition de briques d’analyse des services utilisés par les sites internet impliqués dans la diffusion de contenus problématiques (portant par exemple atteinte à la propriété intellectuelle). L’objectif est d’identifier les acteurs participant le plus au financement et au fonctionnement de ces sites (régies publicitaires et annonceurs, programmes d’affiliation, services de mesure d’audience et de traçabilité, systèmes de paiement en ligne, etc.).
Rapports des plateformes sur la modération des contenus
Accompagnement de l’Arcom dans la conception des rapports de transparence demandés aux plateformes relatifs à la modération des contenus par leurs services, l’étude des algorithmes de modération et la définition du suivi d’indicateurs publiés.
Détection automatique de pratiques commerciales trompeuses
Appui à la DGCCRF dans la détection automatique de pratiques commerciales trompeuses via le développement d’un outil dédié à partir de cas d’usage.
Obligation de portabilité : identification de l’exhaustivité des données personnelles téléchargeables
En lien avec la CNIL, étude comparative entre les données collectées par les plateformes et celles effectivement retournées à l’utilisateur au titre de l’exercice de son droit à la portabilité ou de son droit d’accès.
Consommation de bande passante des services de média à la demande sur différents terminaux
En lien avec la DGE, réalisation d’une étude sur l’adaptation de la qualité du flux vidéo et de sa consommation en bande passante selon le terminal de l’utilisateur pour des plateformes de média à la demande.
Valeur du consentement
Appui à la CNIL pour réaliser une analyse exploratoire de l'impact du parcours web d’un utilisateur sur le niveau des enchères publicitaires menées par les annonceurs pour afficher leur publicité.
Partitionnement automatisé de données (clustering)
Conception et déploiement d’une interface de programmation applicative en ligne (API web) permettant aux partenaires du PEReN et à son équipe d’accomplir des tâches de clustering, ou partitionnement de données, de manière simplifiée, c’est à dire sans nécessiter la mise en œuvre d’un entraînement coûteux et basé sur des techniques d’étiquetage.
Analyse de corpus textuels volumineux par traitement automatisé du langage
Dans une logique de mutualisation, mise à disposition de tous les partenaires du PEReN, et de son équipe, d’une interface de programmation applicative en ligne (API web) offrant des fonctionnalités d’analyse de texte (détection de ngrams, d’entités nommées ou de similarités entre unités textuelles).
Collecte automatisée de données publiquement accessibles (scraping)
Dans une logique de mutualisation, mise à disposition de tous les partenaires ayant des besoins de scraping, et justifiant des compétences juridiques requises, d’une interface de programmation en ligne (API web) de collecte automatisée de données publiquement accessibles.
Exploration des interfaces trompeuses ou Dark Patterns
Animation d’un groupe de travail destiné à faire un état des lieux des connaissances scientifiques mais aussi des textes réglementaires sur les Dark Patterns, assurer une veille documentaire sur le sujet et réfléchir aux approches techniques permettant de les analyser.
Projet Privacy Sandbox de Google
Animation d'un groupe de travail réunissant toutes les administrations intéressées (ministères de la Culture et de l’Économie, Autorité de la concurrence, CNIL, Arcom) et dédié à l’analyse technique mutualisée de la future Privacy Sandbox de Google et à une veille sur le sujet.
Qualité de service des messageries OTT
A la demande de l’Arcep, conception d’une interface applicative permettant d’automatiser des tests qualité sur des services de messageries instantanées OTT (Over The Top ou par contournement) sous différentes conditions d’utilisation réalistes de l’appareil (géolocalisation, batterie, qualité du réseau…) (code open source de l’outil : https://code.peren.fr/peren/2022-qualit-de-service-des-messageries-ott/qualott ).
Applications mobiles : identification des données personnelles transmises
En appui à la CNIL, développement d’un outil facilitant l’identification des accès par des applications mobiles à des données personnelles, avec ou sans consentement préalable.
Suivi automatique des rapports environnementaux des plateformes
Sur demande de la DGE, mise en œuvre d’un outil de collecte automatique des rapports environnementaux dont la publication par les opérateurs de plateforme est une obligation réglementaire, en vue d’en exploiter le contenu pour réaliser des analyses comparatives et suivre leur évolution (code open source de l’outil : https://code.peren.fr/peren/2022-analyse-de-rapports ).
Cadre juridique du scraping, échanges sur les pratiques
Animation d’un groupe d’échanges autour des pratiques de collecte automatisées de données (scraping) mises en œuvre par les différentes organisations publiques et du suivi des évolutions techniques et juridiques en la matière afin de suggérer de potentielles évolutions du cadre législatif ou des pratiques.
Appui sur la recherche
Rencontres académiques autour des applications techniques du DSA
Organisation d’entretiens avec des représentants du monde de la recherche pour un état des lieux académique en matière d’audit algorithmique au regard des besoins techniques des régulateurs. Ces rencontres ont pour objectif de permettre la rédaction de lignes directrices pour les applications techniques du DSA.
Faisabilité des approches de l'Election Integrity Partnership
Initiative du Stanford Internet Observatory et de l’Université de Washington, l’Election Integrity Partnership vise à fournir aux académiques et à la société civile des outils et des méthodes d’évaluation de la prévalence de contenus nuisibles au processus démocratiques. Le PEReN a fourni un support technique à des chercheurs du centre GEODE pour évaluer la possibilité d’appliquer les mêmes méthodes au contexte français.
Détection et caractérisation de contenus viraux
Prolongement du projet lancé en 2021 à la demande du ministère de la Culture. En application de travaux académiques, il vise à développer une méthodologie de détection des contenus viraux susceptibles d’être problématiques en s’appuyant sur leurs propriétés de propagation et non sur une analyse directe du contenu ou des personnes impliquées. Focus 2022 : quantifier la notion de viralité à partir d’indicateurs statistiques en se concentrant sur les contenus à forte visibilité.
Anonymisation des données des travailleurs des plateformes
Initialisation des travaux pour l’élaboration d’un outil destiné aux travailleurs des plateformes leur permettant de visualiser les données qu’ils peuvent retrouver sur leur propre compte propre (par exercice du droit à la portabilité du RGPD) et de pouvoir les communiquer à des tiers agrégateurs après anonymisation.
Comparaison des algorithmes d‘autocomplétion
Sur la base d’une bibliographie académique, exploration du fonctionnement d’algorithmes d’autocomplétion (assistance à la saisie par suggestion de mots, phrases ou expressions) de plateformes numériques.
Création de personas pour l’API de scraping
Création de personas (profils web d’utilisateurs fictifs définis par un ensemble de cookies) afin d’étudier l’impact d’algorithmes ou de traitements différenciés sur le web en fonction de segments de profils utilisateurs. Ces outils constituent un développement d’intérêt académique qui a été présenté au colloque APVP (Atelier de Protection de la Vie Privée) en 2023.
Étude de la faisabilité de méthodes pour une analyse de contenus multimodaux
Exploration de techniques d’apprentissage faiblement supervisées permettant de traiter conjointement images et textes associés sur les plateformes numériques. L’étude préalable de l'état de l'art a permis notamment d’identifier les architectures à choisir.
Diffusion des savoirs
Séminaires académiques
Animation de rencontres trimestrielles ayant pour objectif de favoriser les échanges entre administrations en charge de la régulation des plateformes numériques et le monde de la recherche. Lors de ces rencontres, un chercheur ou un expert est invité à présenter ses travaux sur des thématiques en lien avec les activités du PEReN.
Collection « Éclairages sur…
Publications trimestrielles dans le cadre la collection « Éclairage sur… » qui propose, dans un esprit de vulgarisation, des éléments d’analyse techniques sur des thèmes liés à la régulation des plateformes numériques (numéros parus disponibles ici : https://www.peren.gouv.fr/publications/ ).
Ouverture de codes source
Publication en open source, dans un espace dédié (https://code.peren.fr/peren/), des codes de services applicatifs et outils mis en production.
Organisation d’un événement annuel grand public
Sous le haut patronage du Ministre délégué chargé de la Transition numérique et des Télécommunications, avec l’appui de la DGE et en partenariat avec Inria, le CNNum et Sciences Po Paris, organisation d’un événement grand public alliant conférences et hackathon pour mobiliser l’intelligence collective autour des enjeux liés à la régulation numérique.
Décryptage d’AMP, technologie Google d’optimisation d’affichage d’une page web
Étude visant à comprendre le fonctionnement détaillé de la technologie AMP de Google, d’analyser la pertinence des différents arguments avancés par Google (impact de la durée de chargement, mise en cache sur d'autres serveurs…) et d’évaluer de potentielles alternatives à cette technologie (étude disponible ici : https://www.peren.gouv.fr/actualites/2022-10-17_eclairage_sur_amp/ ).
Traitement automatique des rapports de transparence
Réalisation d’un outil de visualisation des rapports de transparence que les opérateurs de plateforme ont l’obligation de publier et de mise en forme dans un format facilement exploitable manuellement ou automatiquement.
Impact des algorithmes sur la requalification des travailleurs
Identification et analyse des jurisprudences et textes légaux (en vigueur et en discussion) portant sur les algorithmes des plateformes numériques de travail afin de mieux comprendre les exigences légales et les moyens utilisés pour caractériser ces algorithmes et leur impact. Promotion de cette expertise à la fois auprès de chercheurs et autorités de régulation.
Suivi des prix et délais de livraison pratiqués par les places de marché
Étude des possibilités de suivi historisé des évolutions de prix et délais de livraison sur les sites de e-commerce afin de vérifier que les informations disponibles publiquement et pouvant être collectées sont suffisantes pour permettre des analyses par les services compétents ou, dans un second temps, l’élaboration d’algorithmes de détection de mauvaises pratiques. L’expérimentation a permis de valider la mise au point d’un outil de suivi qui pourra être utilisé par des administrations intéressées.
Création de profils de test
Génération de profils d’utilisateurs types, définis par un historique de navigation (cookies), dans le but d’étudier l’impact de la personnalisation sur les résultats fournis par les algorithmes ou les interfaces d’une plateforme. Cette expérimentation a confirmé la possibilité de créer des profils personnalisés exploitables pour l’étude du fonctionnement d’algorithmes de recommandation. Toutefois, la mutualisation de ces profils types reste limitée en raison du code informatique requis très dépendant de la plateforme potentiellement étudiée. Sans rechercher un outil universel, des outils spécifiques reposant sur cette expérimentation pourront être développés au cas par cas.
Convergence algorithmique des contenus
Étude de la faisabilité d’un outil capable de réaliser automatiquement un parcours utilisateur sur une plateforme en ligne de vidéos à la demande selon des préférences déterminées, sans stockage des vidéos ni analyse de leur contenu mais uniquement en utilisant la description textuelle qui en est faite. Un tel outil permettrait d’étudier les algorithmes de recommandation, notamment s’agissant des bulles de filtre (enfermement informationnel). Si l’expérimentation a permis d’élaborer un outil de collecte sur applications mobiles, elle a confirmé que les seules descriptions des vidéos n’étaient pas suffisantes pour une analyse du phénomène de bulle de filtre. L’analyse du contenu de la vidéo et de la bande son d’accompagnement sont apparues nécessaires.
Audit algorithmique en boîte noire
Développement de méthodes d’évaluation des principaux paramètres algorithmiques d’une plateforme, en testant directement son interface publique, c’est-à-dire sans nécessiter sa coopération active. Cette expérimentation a permis de développer des stratégies d’optimisation pour adapter automatiquement les échantillons demandés et ainsi minimiser le volume de requêtes nécessaires. Elle a ainsi permis de développer des briques logicielles d’audit algorithmique pouvant s’adapter à des stratégies de tarification dynamique ou surge pricing (tarification incitative). L’évaluation des principaux paramètres algorithmiques en boîte noire pourrait ainsi permettre de confronter les obligations de transparence consacrées par le règlement européen P2B à l’expérience.
Analyse du type de réseau routier proposé aux automobilistes par les calculateurs d’itinéraires
Aux fins d’évaluation de mise en œuvre des obligations de la loi Climat et Résilience, développement de briques logicielles nécessaires à la collecte automatique des itinéraires proposés par des calculateurs d’itinéraires, au rapprochement des ces itinéraires avec les bases de données géographiques nationales du réseau routier et à la catégorisation automatique des axes empruntés en tant que partie du réseau routier principal ou secondaire. Le dernier objectif de cette expérimentation, à savoir le développement de briques d’analyse de la conformité des itinéraires proposés aux obligations des plateformes, a été limité au vu du faible volume de données disponibles.
Télécharger le rapport d'activité 2022 du PEReN