Un module d’enrichissement des données pour la plateforme DATAtourisme

GettyImages - Igor Kutyaev

La plateforme DATAtourisme se dote d’un module d’enrichissement des données touristiques publiques permettant d’intégrer un traducteur en ligne et d’accéder à des photos issues de la base WikiData.

DATAtourisme est un dispositif piloté par la Direction générale des Entreprises du ministère de l’Economie, des Finances et de la Relance, en partenariat avec ADN Tourisme, lauréat du Programme d’Investissements d’Avenir. En 2020, plusieurs évolutions majeures ont été apportées à la plateforme nationale afin d’accroître l’exploitation en open data des données dans le secteur touristique. Une version augmentée de la plateforme est désormais disponible en ligne. Elle permet aux utilisateurs de bénéficier de la traduction en anglais de toutes les données et de photos accessibles grâce au concept du Liked Open Data.

L’objectif premier du dispositif national DATAtourisme est de rassembler au sein d’une plateforme unique l’ensemble des données touristiques institutionnelles produites par les Offices de tourisme et les Comités départementaux  et régionaux du tourisme et de les rendre disponibles à tous en open data. Ce projet permet aux start-ups et entreprises mais aussi aux associations et collectivités, d’accéder à plus de 350 000 événements et points dintérêt touristiques afin de créer des services numériques innovants et participer ainsi à la valorisation de l’ensemble du patrimoine français. Dans le contexte actuel, le dispositif national participe aussi à la relance sectorielle, en facilitant la création d’outils comme la Carte interactive créée en juin 2020 en partenariat avec Atout France, ADN Tourisme et l’IGN, qui a permis de mettre à disposition du grand public la liste des prestations touristiques ouvertes et engagées dans le respect des consignes sanitaires sur l’ensemble du territoire.

Afin de rendre le dispositif plus attractif et encourager le développement de nouveaux cas d’usage, la Direction générale des Entreprises a mis en œuvre plusieurs évolutions majeures tout au long de l’année 2020 :

En juin dernier, de nouveaux formats de diffusion des données, XML et JSON, ont été proposés. Puis un assistant en ligne a été intégré en octobre dernier pour accompagner les réutilisateurs dans l’utilisation de la plateforme et leur permettre de récupérer les données en quelques clics.

L’optimisation du dispositif s’est poursuivie en fin d’année avec, la mise en place d’un module d’enrichissement automatisé permettant de compléter les données publiées par les territoires avec des contenus tiers :

  • Traduction automatique : grâce à lAPI DeepL, lensemble des données bénéficie désormais dune traduction en anglais de qualité, facilitant la création de services à destination d’utilisateurs non francophones. D’autres langues pourront être ajoutées à l’occasion de futurs évolutions.
  • Lien vers les données WikiData : le format natif de la plateforme DATAtourisme, basé sur les technologies du web sémantique, permet à la plateforme nationale de relier ses données à celles présentes dans des bases tierces. Ainsi, un lien de correspondance entre les points d’intérêt de type « sites naturels » et « sites culturels », présents dans DATAtourisme, et la base WikiData permet aux réutilisateurs daccéder à des fichiers médias librement réutilisables, en complément des photos fournies par les acteurs institutionnels.

Avec ces nouvelles fonctionnalités, la Direction générale des Entreprises et le réseau ADN Tourisme font franchir au dispositif DATAtourisme un nouveau pas dans le mouvement du « Linked open data* » et participent, pour le secteur touristique, au développement du web des données.

* Linked Open Data, ou LOD : données ouvertes liées.

La plateforme nationale www.datatourisme.gouv.fr est un dispositif de collecte, d’uniformisation et de diffusion en open data des données touristiques produites et diffusées par les acteurs institutionnels de tourisme (offices, agences départementales et comités régionaux de tourisme) mise en place conformément aux engagements pris par le ministère de l’Economie, des Finances et de la Relance dans le cadre du Conseil Interministériel du Tourisme (CIT).

Cette plateforme, mise en service en décembre 2017, et fruit d’une collaboration entre la DGE, ADN Tourisme, les comités départementaux et régionaux du tourisme, les offices du tourisme ainsi qu’une vaste communauté d’acteurs touristiques et d’entreprises ré-utilisatrices de données, met actuellement à disposition plus de 350 000 événements et points d’intérêt touristiques émanant des 13 régions métropolitaines.

 

Tous ces chantiers sont conduits en lien étroit avec les territoires, le département Etalab de la Direction interministérielle du numérique (DINUM), partenaire de la démarche DATAtourisme, afin de garantir l’adéquation de cette politique nationale de diffusion de la donnée touristique avec l’évolution du cadre législatif relatif à l’ouverture des données publiques porté par le Gouvernement à plus large échelle.

Liens et téléchargements

Mis à jour le 14/12/2020

Partager