Données liées restreintes (Closed linked data)

MCF en SIC, Université Polytechnique des Hauts de France (INSA), Laboratoire LARSH, département DEVISU, Chaire UNESCO ITEN

La notion recouvre les lots de données qui adhèrent aux principes de publication du Web Sémantique, mais dont l'accès et l'utilisation, contrairement aux données liées ouvertes, sont soumis à des restrictions d’accès juridiques ou techniques au-delà des simples obligations de paternité (Attribution) ou de partage à l'identique (Share-Alike).

Toute situation territoriale se définit comme un système complexe dont les facteurs sont en interactions multiples. Cette approche systémique nécessite de la part des acteurs territoriaux (qui sont aussi interacteurs de ce système) de trouver des modalités de publication de leurs données permettant de les inscrire volontairement dans un continuum sémantique territorial de Web de Données Liées, et ainsi partager, trouver, échanger, réutiliser, associer, plus simplement et sans entremise, des données d’intérêt général susceptibles par exemple d’accompagner la mise en œuvre des ODD d’une ville.

Il est parfaitement entendable que des Activités d’Importance Vitale comme les communications, la gestion de l’eau, de l’alimentation, de l’énergie, des transports etc., qui produisent, distribuent des biens ou des services indispensables aux territoires, ne puissent publier ouvertement leurs données pour des raisons stratégiques de sécurité ; d’autres acteurs prendraient également un risque à publier ouvertement leurs données pour des raisons évidentes de concurrence. En raison de pressions financières ou de confidentialité stratégique, certains d’entre eux peuvent ainsi faire le choix d’un modèle de publication fermé (Closed Data), mais il serait dommageable pour la ville que ces lots de données sortent de l’écosystème du Web Sémantique. Il est donc important de saisir les implications des données liées restreintes, afin de s’assurer que les avantages du Web de données – notamment le fait que les liens entre ensembles de données puissent contribuer à générer de la valeur ajoutée au sein d’écosystèmes de données – ne soit balayé par des exigences de restrictions d’accès et/ou de licences qui viendront inévitablement renforcer les effets de silo. Les organisations gagneraient énormément à éditer leurs données sous forme de Données Liées Restreintes : (i) afin de pouvoir les articuler en interne à des Données Liées Ouvertes extérieures ; (ii) Elles font savoir que leurs données existent en rendant accessibles sur le Web de Données leurs descriptions détaillées et « Modèle conceptuel domaine ou métier »  ; (iii) Elles sont très rapidement en mesure d’enrichir, à la demande et sous certaines conditions d’accès et de licence, les écosystèmes territoriaux de données liées.

Héritiers de la culture de l’Open Science, les travaux de recherche sur les données liées restent relativement éloignés du Web de Données Restreintes, privilégiant les Données Liées Ouvertes, domaine pour lequel les restrictions de licence sont déjà pourtant courantes, notamment les licences permissives : critère de paternité (Attribution) ou de partage à l’identique (Share-Alike). Enrichir le Web de données d’un large éventail de modalités souples, modulaires et automatisées en termes d’authentification (ou restrictions d’accès : qui est autorisé « à voir » les données) et d’autorisation (licences d’usages : ce que les usagers sont autorisés « à faire » avec les données), revêt aujourd’hui une importance stratégique pour les éditeurs susceptibles de contribuer positivement à enrichir les référentiels de données liées des Villes et des Territoires.

Si la publication de lots de Données Liées Ouvertes (Open Linked Data) reste en soi une incitation vertueuse, peu d’organisations sont prêtes (ou capables) d’en ouvrir l’accès sans restriction technique et/ou juridique. Dès lors identifier des modèles de valorisation, de sécurisation, de revenus (le profit restant encore bien souvent la meilleure des incitations) en interaction avec les modèles de publication du Web de données, est également nécessaire afin de pouvoir publier des données stratégiques et/ou de haute qualité. A l’image de certains modèles adoptés par les éditeurs de presse, les organisations pourraient par exemple progressivement adopter un modèle d’accès par abonnement à leur données liées et mettre parallèlement à disposition des non-abonnés une formule d’appel qui leur permettrait de consulter gratuitement un certain volume de données liées, correspondant à une période limitée ou à un territoire dé-limité, par exemple pour des villages ou des petites villes. Cette gratuité locale (Copyleft) pourrait être compensée par un accès sur abonnement aux grandes métropoles, afin d’assurer des formes de péréquation. Ces modèles présenteraient également l’avantage de transformer de petits territoires en terrains d’expérimentations, l’organisation renforce sa réputation en termes de service sur les données liées et un continuum local d’acteurs monte de concert en compétence.

Contributions
Pour contribuer, connectez-vous ou inscrivez-vous