La plateforme data.gouv.fr est le portail national des données publiques françaises. Mise en ligne par Étalab en 2011 et refondue à plusieurs reprises, elle constitue le point d’accès unique aux jeux de données produits par les administrations centrales, les collectivités territoriales, les opérateurs publics et leurs partenaires. Elle héberge en 2026 plus de 500 000 jeux de données et des milliers d’API publiques. Ce guide explique comment naviguer dans la plateforme, identifier les jeux de données les plus utiles et les réutiliser dans le respect de la licence applicable.
Origine et finalité de la plateforme
La plateforme a été créée en 2011 dans le cadre de l’Open Government Partnership (OGP), dont la France est devenue membre fondateur. Elle est aujourd’hui gérée par Étalab, département de la Direction interministérielle du numérique (DINUM), placée auprès du Premier ministre.
L’objectif de la plateforme est triple :
- Rendre accessibles au plus grand nombre les données produites par les administrations ;
- Faciliter leur réutilisation par les citoyens, journalistes, chercheurs et entreprises ;
- Améliorer la transparence et l’efficacité de l’action publique.
La loi pour une République numérique (2016) a renforcé l’obligation d’open data en imposant la publication par défaut des bases de données détenues par l’administration et mises à jour automatiquement.
La structure de la plateforme
Le site data.gouv.fr repose sur quatre objets principaux :
- Les jeux de données (datasets) : ensembles de fichiers regroupés autour d’un sujet ;
- Les organisations : producteurs de données (ministères, agences, collectivités) ;
- Les réutilisations : applications, articles, visualisations construits à partir des données ;
- Les discussions : commentaires et signalements sur les jeux de données.
Chaque jeu de données dispose d’une page descriptive contenant les fichiers, une description, la licence applicable, la fréquence de mise à jour et les statistiques d’usage.
Rechercher un jeu de données
Recherche libre
La barre de recherche en haut de la page permet d’interroger l’ensemble des jeux de données. Les résultats sont triés par pertinence, popularité ou date de mise à jour.
Filtres et facettes
Plusieurs filtres permettent d’affiner :
- Format : CSV, JSON, GeoJSON, SHP, XML, PDF, etc. ;
- Licence : Licence Ouverte 2.0, ODbL, autres ;
- Organisation productrice ;
- Couverture géographique : France entière, région, département, commune ;
- Périodicité : ponctuel, quotidien, mensuel, annuel.
Catalogues thématiques
La plateforme propose des sélections curatées par thème : transports, environnement, santé, éducation, culture, sécurité, économie, etc.
Les jeux de données phares
Quelques jeux de données figurent parmi les plus consultés et réutilisés :
| Jeu de données | Producteur | Contenu |
|---|---|---|
| DVF (Demandes de valeurs foncières) | DGFiP | Transactions immobilières des 5 dernières années |
| SIRENE | INSEE | Registre des entreprises (32 millions d’établissements) |
| Résultats électoraux | Ministère de l’Intérieur | Résultats officiels de toutes les élections |
| Base Adresse Nationale (BAN) | ANCT / IGN / La Poste | Référentiel d’adresses |
| Données carto IGN | IGN | Cartographies (BD TOPO, OCS GE) |
| COVID-19 (Santé publique France) | SPF | Données épidémiologiques (rétrospectif) |
| Météo-France | Météo-France | Observations et prévisions |
| GTFS transports en commun | AOM / collectivités | Horaires de transport en open data |
| Subventions aux associations | Plateforme nationale | Subventions versées aux associations |
| Marchés publics | DAJ / collectivités | Données essentielles des marchés publics |
Les formats de données
Les jeux de données sont publiés dans une diversité de formats :
- CSV (Comma-Separated Values) : format tabulaire universel, le plus répandu ;
- JSON : format structuré, adapté aux usages logiciels ;
- GeoJSON, SHP, GPKG : formats géographiques ;
- XML : formats structurés, parfois sectoriels (XBRL, JATS) ;
- PDF : pour les documents non structurés ;
- Parquet : format colonne, adapté aux très gros volumes.
La plateforme privilégie les formats ouverts et interopérables.
Les API publiques
Au-delà des fichiers, data.gouv.fr et les administrations partenaires exposent de nombreuses API :
- API SIRENE (INSEE) : interrogation en temps réel du registre des entreprises ;
- API découpage administratif : codes communes, départements, régions ;
- API Base Adresse Nationale : géocodage adresses ;
- API Recherche d’entreprises (gouvernement) ;
- API Météo-France ;
- API DVF : recherche de transactions immobilières.
Ces API sont la plupart du temps gratuites et accessibles sans clé, dans la limite de quotas de requêtes.
La licence ouverte 2.0
La très grande majorité des jeux de données sont diffusés sous Licence Ouverte 2.0, rédigée par Étalab et compatible avec les standards internationaux (notamment CC-BY 2.0). Cette licence autorise :
- la réutilisation des données pour tous usages, y compris commerciaux ;
- la modification et la redistribution des données ;
- sous réserve de la mention de la source (producteur et date de mise à jour).
Certains jeux sont publiés sous ODbL (Open Database License), qui impose une clause de partage à l’identique (les œuvres dérivées doivent rester ouvertes).
Contribuer à data.gouv.fr
Toute organisation publique ou privée peut contribuer à la plateforme :
Inscription d’une organisation
- Création d’un compte ;
- Demande de rattachement à une organisation existante ou création d’une nouvelle ;
- Validation par les administrateurs Étalab.
Publication d’un jeu de données
- Téléversement de fichiers ou indication d’URLs externes ;
- Renseignement des métadonnées (titre, description, licence, fréquence de mise à jour, couverture géographique) ;
- Documentation et schéma de données (recommandé).
Référencement d’une réutilisation
Tout utilisateur peut signaler une réutilisation : application, visualisation, article de presse, étude académique. Cette pratique enrichit l’écosystème en valorisant les usages concrets des données.
Quelques cas d’usage
- Journalisme de données : analyses sur les subventions, les achats publics, les écarts de richesse, le logement, la santé.
- Recherche académique : exploitation de la base DVF, des bases INSEE, des données fiscales agrégées.
- Applications mobiles : transports en commun, qualité de l’air, déchets, stationnement.
- Outils citoyens : visualisations électorales, suivi de l’action publique, applications de transparence (NosDéputés, RegardsCitoyens).
- Études économiques : croisements SIRENE-DVF pour comprendre les territoires.
Erreurs courantes à éviter
- Ignorer la licence applicable. Vérifiez toujours la licence avant de réutiliser les données : Licence Ouverte 2.0 et ODbL ont des contraintes différentes.
- Réutiliser des données sans citer la source. La mention du producteur et de la date de mise à jour est obligatoire.
- Confondre données ouvertes et données personnelles. Les données nominatives ne sont jamais publiées en open data ; toute base contenant des informations personnelles doit passer par une anonymisation rigoureuse.
- Croire que tout est exhaustif et à jour. La qualité varie selon les jeux : vérifiez la date de la dernière mise à jour et les métadonnées de qualité.
- Sous-estimer les limites des API. Les API publiques imposent des quotas : prévoyez des stratégies de cache ou un téléchargement complet du jeu de données pour les usages intensifs.
Questions fréquentes
Faut-il créer un compte pour télécharger les données ?
Non, la consultation et le téléchargement sont libres et gratuits, sans inscription. Le compte n’est requis que pour publier des jeux de données ou des réutilisations.
Combien de jeux de données sont disponibles ?
La plateforme héberge plus de 500 000 jeux de données en 2026, alimentés par des milliers d’organisations publiques. Ce chiffre progresse de plusieurs dizaines de milliers chaque année.
Comment signaler une donnée erronée ?
Chaque jeu dispose d’un espace « Discussions » où vous pouvez interpeller le producteur. Vous pouvez aussi le contacter directement via le site de l’organisation.
Existe-t-il des forums ou conférences ?
Oui : l’Open Data Camp, les rencontres OpenDataConference et les ateliers organisés par Étalab et les associations comme OpenStreetMap France ou Open Knowledge France.
Comment télécharger en masse ?
Pour les volumes importants, utilisez les API CKAN/uData de data.gouv.fr ou les exports proposés par les producteurs eux-mêmes (FTP, S3, dépôts Git). Évitez le téléchargement automatisé non maîtrisé qui peut saturer les serveurs.
Guides liés
Cadastre.gouv.fr 2026 : consulter le plan cadastral
Comment consulter le plan cadastral en 2026 : parcelles, contenance, propriétaires, valeur locative et articulation entre cadastre.gouv.fr et données DGFiP.
INSEE 2026 : utiliser les statistiques officielles
Comment utiliser les statistiques de l'INSEE en 2026 : organisation, productions phares (recensement, IPC, chômage, comptes nationaux), portail INSEE.fr et API.
DVF 2026 : Demandes de valeurs foncières (transactions immobilières)
Comprendre la base DVF 2026 : transactions immobilières sur 5 ans, géolocalisation à la parcelle, mise à jour DGFiP, API publique, biens et prix accessibles.