data.gouv.fr 2026 : utiliser la plateforme nationale

Comment utiliser data.gouv.fr en 2026 : recherche, organisations, formats, API, jeux de données phares (DVF, SIRENE, élections), licence ouverte et contribution.

Données ouvertes Publié le 24 mars 2026 Mis à jour le 15 mai 2026 10 min de lecture
À titre informatif. Les informations fournies sur cette page sont à titre d'orientation. Pour toute démarche officielle, référez-vous aux sites institutionnels cités en sources et, si besoin, à un professionnel.

La plateforme data.gouv.fr est le portail national des données publiques françaises. Mise en ligne par Étalab en 2011 et refondue à plusieurs reprises, elle constitue le point d’accès unique aux jeux de données produits par les administrations centrales, les collectivités territoriales, les opérateurs publics et leurs partenaires. Elle héberge en 2026 plus de 500 000 jeux de données et des milliers d’API publiques. Ce guide explique comment naviguer dans la plateforme, identifier les jeux de données les plus utiles et les réutiliser dans le respect de la licence applicable.

Origine et finalité de la plateforme

La plateforme a été créée en 2011 dans le cadre de l’Open Government Partnership (OGP), dont la France est devenue membre fondateur. Elle est aujourd’hui gérée par Étalab, département de la Direction interministérielle du numérique (DINUM), placée auprès du Premier ministre.

L’objectif de la plateforme est triple :

  • Rendre accessibles au plus grand nombre les données produites par les administrations ;
  • Faciliter leur réutilisation par les citoyens, journalistes, chercheurs et entreprises ;
  • Améliorer la transparence et l’efficacité de l’action publique.

La loi pour une République numérique (2016) a renforcé l’obligation d’open data en imposant la publication par défaut des bases de données détenues par l’administration et mises à jour automatiquement.

La structure de la plateforme

Le site data.gouv.fr repose sur quatre objets principaux :

  1. Les jeux de données (datasets) : ensembles de fichiers regroupés autour d’un sujet ;
  2. Les organisations : producteurs de données (ministères, agences, collectivités) ;
  3. Les réutilisations : applications, articles, visualisations construits à partir des données ;
  4. Les discussions : commentaires et signalements sur les jeux de données.

Chaque jeu de données dispose d’une page descriptive contenant les fichiers, une description, la licence applicable, la fréquence de mise à jour et les statistiques d’usage.

Rechercher un jeu de données

Recherche libre

La barre de recherche en haut de la page permet d’interroger l’ensemble des jeux de données. Les résultats sont triés par pertinence, popularité ou date de mise à jour.

Filtres et facettes

Plusieurs filtres permettent d’affiner :

  • Format : CSV, JSON, GeoJSON, SHP, XML, PDF, etc. ;
  • Licence : Licence Ouverte 2.0, ODbL, autres ;
  • Organisation productrice ;
  • Couverture géographique : France entière, région, département, commune ;
  • Périodicité : ponctuel, quotidien, mensuel, annuel.

Catalogues thématiques

La plateforme propose des sélections curatées par thème : transports, environnement, santé, éducation, culture, sécurité, économie, etc.

Les jeux de données phares

Quelques jeux de données figurent parmi les plus consultés et réutilisés :

Jeu de donnéesProducteurContenu
DVF (Demandes de valeurs foncières)DGFiPTransactions immobilières des 5 dernières années
SIRENEINSEERegistre des entreprises (32 millions d’établissements)
Résultats électorauxMinistère de l’IntérieurRésultats officiels de toutes les élections
Base Adresse Nationale (BAN)ANCT / IGN / La PosteRéférentiel d’adresses
Données carto IGNIGNCartographies (BD TOPO, OCS GE)
COVID-19 (Santé publique France)SPFDonnées épidémiologiques (rétrospectif)
Météo-FranceMétéo-FranceObservations et prévisions
GTFS transports en communAOM / collectivitésHoraires de transport en open data
Subventions aux associationsPlateforme nationaleSubventions versées aux associations
Marchés publicsDAJ / collectivitésDonnées essentielles des marchés publics

Les formats de données

Les jeux de données sont publiés dans une diversité de formats :

  • CSV (Comma-Separated Values) : format tabulaire universel, le plus répandu ;
  • JSON : format structuré, adapté aux usages logiciels ;
  • GeoJSON, SHP, GPKG : formats géographiques ;
  • XML : formats structurés, parfois sectoriels (XBRL, JATS) ;
  • PDF : pour les documents non structurés ;
  • Parquet : format colonne, adapté aux très gros volumes.

La plateforme privilégie les formats ouverts et interopérables.

Les API publiques

Au-delà des fichiers, data.gouv.fr et les administrations partenaires exposent de nombreuses API :

  • API SIRENE (INSEE) : interrogation en temps réel du registre des entreprises ;
  • API découpage administratif : codes communes, départements, régions ;
  • API Base Adresse Nationale : géocodage adresses ;
  • API Recherche d’entreprises (gouvernement) ;
  • API Météo-France ;
  • API DVF : recherche de transactions immobilières.

Ces API sont la plupart du temps gratuites et accessibles sans clé, dans la limite de quotas de requêtes.

La licence ouverte 2.0

La très grande majorité des jeux de données sont diffusés sous Licence Ouverte 2.0, rédigée par Étalab et compatible avec les standards internationaux (notamment CC-BY 2.0). Cette licence autorise :

  • la réutilisation des données pour tous usages, y compris commerciaux ;
  • la modification et la redistribution des données ;
  • sous réserve de la mention de la source (producteur et date de mise à jour).

Certains jeux sont publiés sous ODbL (Open Database License), qui impose une clause de partage à l’identique (les œuvres dérivées doivent rester ouvertes).

Contribuer à data.gouv.fr

Toute organisation publique ou privée peut contribuer à la plateforme :

Inscription d’une organisation

  • Création d’un compte ;
  • Demande de rattachement à une organisation existante ou création d’une nouvelle ;
  • Validation par les administrateurs Étalab.

Publication d’un jeu de données

  • Téléversement de fichiers ou indication d’URLs externes ;
  • Renseignement des métadonnées (titre, description, licence, fréquence de mise à jour, couverture géographique) ;
  • Documentation et schéma de données (recommandé).

Référencement d’une réutilisation

Tout utilisateur peut signaler une réutilisation : application, visualisation, article de presse, étude académique. Cette pratique enrichit l’écosystème en valorisant les usages concrets des données.

Quelques cas d’usage

  • Journalisme de données : analyses sur les subventions, les achats publics, les écarts de richesse, le logement, la santé.
  • Recherche académique : exploitation de la base DVF, des bases INSEE, des données fiscales agrégées.
  • Applications mobiles : transports en commun, qualité de l’air, déchets, stationnement.
  • Outils citoyens : visualisations électorales, suivi de l’action publique, applications de transparence (NosDéputés, RegardsCitoyens).
  • Études économiques : croisements SIRENE-DVF pour comprendre les territoires.

Erreurs courantes à éviter

  1. Ignorer la licence applicable. Vérifiez toujours la licence avant de réutiliser les données : Licence Ouverte 2.0 et ODbL ont des contraintes différentes.
  2. Réutiliser des données sans citer la source. La mention du producteur et de la date de mise à jour est obligatoire.
  3. Confondre données ouvertes et données personnelles. Les données nominatives ne sont jamais publiées en open data ; toute base contenant des informations personnelles doit passer par une anonymisation rigoureuse.
  4. Croire que tout est exhaustif et à jour. La qualité varie selon les jeux : vérifiez la date de la dernière mise à jour et les métadonnées de qualité.
  5. Sous-estimer les limites des API. Les API publiques imposent des quotas : prévoyez des stratégies de cache ou un téléchargement complet du jeu de données pour les usages intensifs.

Questions fréquentes

Faut-il créer un compte pour télécharger les données ?

Non, la consultation et le téléchargement sont libres et gratuits, sans inscription. Le compte n’est requis que pour publier des jeux de données ou des réutilisations.

Combien de jeux de données sont disponibles ?

La plateforme héberge plus de 500 000 jeux de données en 2026, alimentés par des milliers d’organisations publiques. Ce chiffre progresse de plusieurs dizaines de milliers chaque année.

Comment signaler une donnée erronée ?

Chaque jeu dispose d’un espace « Discussions » où vous pouvez interpeller le producteur. Vous pouvez aussi le contacter directement via le site de l’organisation.

Existe-t-il des forums ou conférences ?

Oui : l’Open Data Camp, les rencontres OpenDataConference et les ateliers organisés par Étalab et les associations comme OpenStreetMap France ou Open Knowledge France.

Comment télécharger en masse ?

Pour les volumes importants, utilisez les API CKAN/uData de data.gouv.fr ou les exports proposés par les producteurs eux-mêmes (FTP, S3, dépôts Git). Évitez le téléchargement automatisé non maîtrisé qui peut saturer les serveurs.

Guides liés