Dans un environnement économique pour le moins morose, le secteur des innovations technologiques afférent à l’exploitation de données publiques bénéficie de perspectives commerciales très prometteuses. Les statistiques de l’INSEE, les données du trafic routier, les informations sur les jardins publics, les listes des gares SNCF et les statistiques de ponctualité des TGV sont en effet autant d’informations brutes qui ne demandent qu’à être génératrices de valeurs ajoutées une fois entre les mains d’opérateurs privés ingénieux.
Dans le prolongement d’un mouvement culturel mondial apparu au début des années 2000 visant à rendre les données publiques et transparentes, la France, transposant les termes de la directive 2003/98/CE, a consacré le principe de la libre réutilisation de la donnée publique dès 2005, notamment à travers l’ordonnance n°2005-650 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques.
UN ENGOUEMENT RÉCENT
Ce n’est pourtant que très récemment, sous l’effet de l’explosion du marché des applications pour smartphones, que les opérateurs économiques, tant publics que privés, ont pris la mesure du potentiel économique lié aux exploitations innovantes de ces données publiques.
En décembre 2011, la mission Etalab a lancé un portail unique interministériel des données publiques. La plateforme recense à ce jour plus de 350.000 jeux de données, provenant de l’administration centrale, d’établissements publics, d’autorités administratives indépendantes et de certaines collectivités territoriales.
La mission Etalab a par ailleurs élaboré une « Licence ouverte » aux fins de contractualiser les conditions de la réutilisation des données mises à disposition et ainsi sécuriser tant les producteurs que les utilisateurs de celles-ci. Cette licence gratuite, compatible avec les principales licences open data standard internationales (ODC-BY, CC-BY 2.0), permet à l’utilisateur une exploitation commerciale très large des données mises à disposition, sous réserve néanmoins de la mention de la paternité de celles-ci.
DES LICENCES OPEN DATA TRÈS HÉTÉROGÈNES
Mais l’engouement pour le phénomène open data est tel qu’à ce jour et au-delà même des opérateurs publics, bon nombre de sociétés privés ont vu un intérêt commercial à rendre disponible des informations qu’elles protégeaient jusque-là au nom de leurs droits de propriété intellectuelle. Dans ce contexte, force est de constater un développement diffus des licences open data auxquelles les opérateurs peuvent recourir.
A titre d’exemple de l’hétérogénéité régnant sur le sujet, l’on peut nommer le cas des licences Creative Commons (CC), qui sont au nombre de six modèles dont le contenu varie en fonction des choix de l’auteur quant à la combinaison des quatre options possibles et codifiée sous la forme d’un sigle en deux lettres : mention de la paternité (BY), pas de modification (ND), pas d’utilisation commerciale (NC), partage à l’identique (SA). Si la licence CC-BY n’exige que la mention de paternité, la licence CC-BY-NC-SA va, en plus, interdire toute utilisation commerciale et n’autoriser la création d’œuvres dérivées qu’à condition qu’elles soient distribuées sous une licence de partage identique.
ATTENTION À LA CONTREFAÇON INVOLONTAIRE
Si le dynamisme de ces pratiques ouvre d’intéressantes perspectives, il convient néanmoins d’inviter les entrants à une certaine prudence.
En premier lieu, l’on invitera les opérateurs souhaitant intervenir sur ce type de marché à être vigilant sur le périmètre de la licence octroyée ; le qualificatif générique "licence open data » revêtant en réalité des contenus hétéroclites. La licence Etalab est utilisée pour la plupart des données mises à disposition par les organismes publics visées par l’Ordonnance, mais d’autres opérateurs, non visés par l’Ordonnance, ont mis en place leurs propres licences, avec, en général, des conditions d’utilisation des données plus strictes et un périmètre d’exploitation plus restreint. Dans ces conditions, il y a fort à parier qu’un utilisateur négligent, mis en confiance par le seul terme de « licence open data", puisse finalement se retrouver en position de contrefacteur en exploitant de bonne foi les données au-delà de ce qu’autorise expressément ladite licence.
En second lieu, les exploitants de données sous licence open data seront fortement invités à s’interroger sur l’éventuel effet contaminant de certaines licences. En effet au-delà des mentions d’attribution de paternité devant être reproduites et à l’instar de principes applicables à certains logiciels open source, certaines licences open data obligent le licencié à autoriser l’exploitation par les tiers des adaptations effectuées sur les données sous licence, dans les mêmes conditions que celles applicables aux données concernées. En d’autres termes, les travaux effectués par l’exploitant des données seront sujets aux mêmes conditions de licence.
La notion "adaptation" peut, selon le cas, soulever des questions d’interprétation. Dès lors que les données sous licence sont adaptées et, dans le même temps, intégrées dans un ensemble plus large, il ne sera pas toujours aisé de circonscrire précisément l’effet contaminant sur ledit contenu.
Pourtant cette question est d’importance dans la mesure où, de par cet effet contaminant, l’exploitant ne sera plus en mesure de se réserver l’exploitation du contenu concerné ou de concéder des licences exclusives auprès de tiers.
Si l’intérêt grandissant pour les innovations exploitant des données publiques est tout à fait justifié, il convient, pour celui qui travaille sur ce type d’exploitation, de garder à l’esprit que sous le vocable "open data", l’on retrouve en réalité des licences aux contenus très différents dont il ne pourra ignorer la portée exacte sous peine de mettre en péril son investissement.
Marc Schuler / Guillaume Raimbault, Avocats à la Cour