[MUSIQUE] [MUSIQUE] [MUSIQUE] [MUSIQUE] Bienvenue à cette leçon qui va porter sur les métadonnées. Métadonnées qui sont donc les données sur les données et qui jouent un rôle extrêmement important pour conserver la trace de l'acquisition des données que l'on fait pour les systèmes d'informations géographiques. Les objectifs de cette leçon consistent donc à souligner l'importance des métadonnées. Décrire leur contenu dans le contexte de la géoinformation. Et montrer quand et comment ces métadonnées sont utilisées. Au terme de la leçon, vous serez en mesure de documenter un jeu de données. Et de consulter les métadonnées d'un jeu de données, afin de savoir si celles-ci correspondent à vos besoins ou non. Dans cette leçon, nous aborderons donc successivement les principes généraux de documentation d'un jeu de données. Nous verrons ensuite les efforts de normalisation qui ont été menés dans le domaine des métadonnées, pour terminer par quelques exemples illustrant l'utilisation des métadonnées. [MUSIQUE] Avec le développement des systèmes d'informations et des bases de données, à partir des années 60, 70, on a commencé à engranger des masses d'informations dans des systèmes informatiques, pour se rendre compte au bout de quelques mois ou de quelques années que toutes ces données étaient devenues parfaitement inutilisables, faute d'avoir gardé la mémoire des conditions dans lesquelles ces données avaient été acquises, du type de phénomènes qu'elles représentaient. De la précision des données, de tout un tas de paramètres de ce type, qui empêchaient en fait d'utiliser ces données au final. Et on a commencé à parler de ce syndrome du cimetière de données puisque toutes ces grosses bases de données ont finalement pu être enterrées. D'où les deux axiomes suivants. Tout d'abord, l'idée qu'un système d'informations et surtout un système d'informations géographiques est vivant s'il est utilisé. Et pour qu'un tel système soit utilisé, il doit contenir des données fiables, à jour et dont on sait ce qu'elles représentent. Ces deux axiomes ont pour premier corollaire de mettre l'accent sur la maintenance et la mise à jour des données, qui peut représenter un effort important. Et comme deuxième corollaire, le fait que le volume et la nature des données que l'on stocke dans un système d'informations doit être adapté au besoin des utilisateurs et aux ressources disponibles pour organiser la maintenance et la mise à jour. C'est pour cette raison que le concept de Big Data, qui est très à la mode ces derniers temps, rencontre un certain scepticisme chez de nombreuses personnes, dont je suis. Les métadonnées, en tant que données sur les données, visent donc à documenter l'information spatiale, de sorte qu'elle soit comprise de la même manière par tous ses utilisateurs. Cela implique que chaque couche de données, que chaque objet, que chaque attribut, soit décrit et caractérisé du point de vue de son échelle et de sa nature. Si l'on regarde maintenant d'un peu plus près sur quoi porte les métadonnées, le premier aspect que l'on aborde est celui de la source de l'information, où l'on peut documenter l'institution qui a produit les données. Éventuellement, l'institution qui l'a édité. Qui distribue ces données. Quelle est la personne de contact? Qui assume la responsabilité de la mise à jour par exemple. Etc, etc. Un deuxième élément important est le contenu. Ici, dans l'exemple de données cadastrales. Tout d'abord, le nom et la description de ces données. On dit qu'elles sont issues de la mensuration officielle, qu'elles comprennent les biens-fonds et la couverture du sol. Qu'elles sont extraites d'une base de données cadastrales officielle. Etc, etc. Le type de données, géométrie, données temporelles, valeurs numériques de types entières ou réelles. Chaînes de caractères, vecteurs, structures d'objets, etc. Dans notre exemple de données cadastrales, la parcelle elle-même est représentée, est de type géométrie, représentée par un polygone. Alors que les attributs, numéro de commune, numéro de parcelle sont des entiers. La désignation et le lien, des chaînes de caractères. Une information sur l'échelle de référence est la précision des données. On voit ici que l'échelle du plan cadastral a été déterminée au moment de la saisie des données. En principe, l'échelle du 500e en zone urbaine, du 1 000e en zone agricole. Et du 5 000e en zone de montagne. La date de saisie des données, ou la date de mise à disposition de ces données sur l'infrastructure de données, ici le 31 décembre 1983. Les éléments quantitatifs constituent un autre aspect des métadonnées, avec notamment le recouvrement spatial. Soit dans le cas de nos données cadastrales, l'ensemble du canton de Vaud. Et le bounding box, c'est-à -dire le cadre qui englobe l'ensemble des données concernées. Des valeurs de volumes comme le nombre d'objets concernés par le jeu de données ou éventuellement l'espace disque occupé par ces données. Les modalités d'accès aux données sont évidemment un élément très important. En particulier, le format dans lequel les données sont distribuées. Les droits éventuels qui s'y rattachent. Les tarifs qui peuvent comme on le voit ici être consultés en ligne. Les restrictions éventuelles qui s'appliquent à l'utilisation des données. L'adresse du service ou de la personne en charge de la diffusion. Ici, l'État de Vaud. [MUSIQUE] [MUSIQUE] Depuis plusieurs années, de nombreux efforts de normalisation des métadonnées ont été entrepris. Efforts qui visent à permettre une meilleure compréhension des géodonnées à différents niveaux, que ce soit celui du producteur, celui de l'administrateur ou de l'utilisateur final. De faciliter les échanges entre divers partenaires et divers systèmes. D'améliorer la capacité de rechercher des données géographiques. Et finalement, de créer un cadre de référence pour le développement de méthodes et d'outils de gestion des métadonnées. Au niveau international, l'organisme en charge de la normalisation dans le domaine de l'information géographique et de la géomatique est connu sous le label ISO/TC 211. Cet organisme a produit la série de normes ISO 19100 dont certaines concernent spécifiquement les métadonnées. En particulier, la 19115 et la 19115-2 qui portent sur la description des géodonnées. La 19119 sur la description des géoservices. Et la 19139 sur l'échange de métadonnées. A l'échelle de l'Union Européenne, la normalisation s'effectue par l'intermédiaire de la Directive INSPIRE. Aux États-Unis, c'est le standard du Federal Geographic Data Committee. Et en Suisse, la norme GM03. Toutes ces normes sont finalement très similaires, puisqu'elles regroupent le même type de données de base. Avec quelques variantes spécifiques. [MUSIQUE] [MUSIQUE] Nous allons à présent voir quelques exemples d'utilisation et de consultation de métadonnées. En commençant par le géoportail de l'IGN-France. Dans ce géoportail, on peut activer le catalogue de données directement, ainsi qu'une zone d'affichage de la sélection des données. On choisit d'afficher la couche des bâtiments qui apparaissent sur la carte. Et dans la zone de sélection, on a les différentes couches avec un bouton d'informations qui donne accès aux métadonnées. En l'occurrence, le nom, une description, le producteur de données et la légende dont on voit qu'elle est différente lorsque l'échelle est plus petite que le 30 000e ou plus grande. Donc, si on zoome un peu dans cette carte pour s'approcher un peu, voir ces choses à une échelle plus petite, on voit qu'effectivement la richesse de description est un peu plus grande avec une plus grande variété de types de bâtiments. Le catalogue de données est également accessible directement avec la liste des différentes données disponibles. Ici, on choisit les parcelles cadastrales pour les afficher. On voit que ces parcelles occupent tout le pays par défaut. Donc, on zoome pour une zone plus précise, avoir quelques informations de détail. Et de nouveau, l'accès aux métadonnées se fait par le bouton Informations. Le nom, une description, l'échelle de saisie, la légende, etc. Dans le catalogue de données, on peut encore ajouter pour l'exemple une couche liée au transport. En l'occurrence, le réseau routier. Ce réseau routier a plus grande échelle apparaît plus clairement, et de nouveau le bouton information donne accès à quelques métadonnées, notamment le producteur qu'est l'IGN et la légende du réseau routier. On vit que dans le cadre de l'IGN-France, la richesse en métadonnées est relativement faible. Second exemple, le géoportail de la région Wallone. On voit que dans la page d'accueil on a accès directement au géocatalogue avec plusieurs thématiques, et dans chaque thématique un ensemble d'applications qui sont autant de systèmes de web SIG accessibles en ligne, et pour chacune de ces applications une fiche descriptive avec notamment les conditions d'accès d'utilisation, la qualité des données, la personne de contact etc. La même chose pour les géodonnées avec par exemple ici pour la carte d'occupation du sol de Wallonie toute la métadonnée pertinente. Les données peuvent être consultées directement dans une carte en ligne, et l'on retrouve dans l'interface en ligne le catalogue de données avec ses différentes thématiques. Ici le réseau routier régional, et pour chaque thématique, comme tout à l'heure, un bouton d'information qui donne accès à la même fiche descriptive contenant les mots clés, les dates de mise à jour, les conditions d'accès d'utilisation, la qualité des données, les personnes de contact etc. On voit ici dans la qualité l'échelle et la manière dont le jeu de données a été constitué, notamment ici sur la base la digitalisation, et les coordonnées de la personne de contact si nécessaire. Dans un bouton supplémentaire offrant accès à davantage d'informations on a accès au modèle complet, en fait, de métadonnées, avec la possibilité de choisir le type de présentation selon la norme européenne, la norme américaine ou d'autres, et différentes actions, notamment la possibilité d'exporter ces données sous différents formats. Ces métadonnées complètes comprennent des informations générales, des éléments décrivant l'origine de la ressource, les aspects géométriques, les coordonnées des personnes de contact pour les métadonnées, les éléments d'information techniques comme les conditions d'accès d'utilisation etc. Le géoportail de la confédération helvétique qui dans son interface comprend également le catalogue de données, avec des données classées par thématiques, et ici on va aller chercher dans la couverture/utilisation du sol une carte de la mixité des forêts. Également un petit bouton d'information qui donne accès à la métadonnée. Donc le nom, la description de cette couche qui a été construite sur une image Landsat. La légende et des informations complémentaires, notamment un lien vers le site internet du géocatalogue des données qui comprend alors lui l'ensemble de la métadonnée des différentes couches concernées, la possibilité de les exporter sous différent formats. Ces métadonnées contiennent un ensemble d'informations, les informations de référence, un résumé descriptif, les données de la personne de contact pour la ressource, la même chose pour la mise à jour et les dates de mise à jour prévues, les contraintes d'utilisation, notamment l'existence d'une licence, les aspects numériques, quantatifs, donc la zone couverte, le mode de distribution, en particulier les formats, le système de référence utilisé donc système de projection, la qualité des données, les responsables de la métadonnée, et des informations sur le cadre législatif qui englobe en fait l'utilisation de ces données. Un autre exemple avec le réseau hydrographique. On voit ici que également la métadonnée comprend la légende détaillée des différents types de tronçons de cours d'eau, et de nouveau des liens vers différents éléments d'information, en l'occurrence également le géocatalogue, où l'on retrouve la même structure de données que tout à l'heure, avec cette fois pour particularité peut-être l'échelle du 25 millième qui a été utilisée pour la digitalisation des données, les formats dans lesquels cette donnée est disponible, donc le shapefile ESRI, mais aussi les différents liens Internet, les hyperliens qui permettent d'accéder en fait au magasin de Swisstopo, au magasin en ligne de Swisstopo qui permet d'acheter ces données. Le système de projection de références, EPSG:21781, dont nous avons déjà parlé dans une précédente leçon, et les informations de contact pour la gestion des métadonnées. Pour terminer à nouveau par les éléments législatifs, en particulier l'ordonnance sur la géoinformation, qui est le cadre juridique qui fixe l'utilisation des données géographiques en Suisse. Et finalement le géoportail du Canton de Vaud, dans lequel nous avons affiché les couches liées à la propriété foncière, et on zoom sur le petit village d'Arnex-sur-Orbe, pour retrouver en fait les données cadastrales que nous avons utilisées dans nos exemples précédents. La parcelle avec ses attributs, et l'on voit que le lien pointe sur les données du registre foncier avec le type d'utilisation du sol et le propriétaire de la parcelle. On voit que la donnée de base, les biens-fonds... La métadonnée peut être consultée directement en ligne, et on trouve un système analogue à ce que l'on a déjà vu avec le nom, la description de la couche, et puis une série d'onglets qui peuvent s'ouvrir ou se fermer pour accéder à différents autres aspects de la métadonnée, en l'occurrence un lien vers la tarification des données, un lien vers la structure de données, vers le modèle de données qui a été utilisé, concept dont nous parlerons dans le second module du cours. On voit également que l'on peut afficher d'autres types d'informations, ici les informations relatives au domaine de la protection des eaux, avec en particulier le réseau hydrographique, et en l'occurrence dans la région un cours d'eau particulier qui est le Talent sauf erreur, oui le Talent, avec les attributs liés à ce cours d'eau, donc son identifiant, son numéro etc. Et de nouveau l'accès aux métadonnées de la couche réseau hydrographique, et on voit que cette couche vient d'un système qui s'appelle Gesreau, qui est en fait le SIG de gestion des cours d'eau du Canton de Vaud. Les données sont accessibles au public, les règles de tarification sont connues, il y a un forfait de base de 25 francs pour récupérer et utiliser ces données. Les principes de diffusion, quelques éléments de complément technique, le système de référence donc c'est le même système de projection. C'est une projection suisse qui a été utilisée. La date à laquelle ces données ont été créées, la date de la dernière mise à jour, et finalement les responsables de la diffusion. Pour conclure nous allons encore voir comment documenter un jeu de données dans QGIS, le logiciel SIG que nous allons utiliser tout au long de ce cours. Nous allons utiliser pour cela un projet contenant des données des Seychelles, projet dont la préparation fait l'objet d'une leçon qui sera présentée dans le cadre du deuxième module de ce cours. On voit que par un clic droit sur la couche des hôtels on peut accéder à ces propriétés, parmi lesquelles une rubrique contient les métadonnées avec une partie descriptive, un titre, les hôtels, un petit résumé pour décrire en fait de quoi il s'agit, éventuellement une liste de mots clés, un format de données, donc texte ou du html, éventuellement un lien internet, une adresse url, et puis un ensemble de propriétés qui ont déjà été définies, en particulier le format de données, le shapefile ESRI, le type de géométrie des points, le nombre d'objets, et l'emprise dans les unités du système de projection utilisé, et les coordonnées de ce système de projection, donc utm zone 40 sud. Autre exemple avec la couche des districts, où on voit de nouveau que par défaut le type de données est une base de données SQL Spatial Lite, avec l'adresse du fichier qui contient ces données, le type de données, les polygones, le nombre d'objets, 25, et de nouveau l'emprise totale de la couche et puis le système de projection utilisé, donc à nouveau utm 40 sud. On voit que dans la version standard de QGIS les possibilités de documentation d'un jeu de données sont relativement limitées. Il y a plusieurs extensions qui sont en cours de développement qui vont progressivement avec le temps corriger cet état de fait, et offrir des instruments plus complets pour la saisie des métadonnées. [MUSIQUE] Nous avons donc vu au cours de cette leçon que les métadonnées jouent un rôle très important pour décrire les jeux de données que l'on utilise dans les systèmes d'informations géographiques. Nous avons vu le type d'information qui était stocké, nom, description, date de création, type de contenu etc. Nous avons vu que ces éléments avaient fait l'objet de plusieurs efforts de normalisation afin d'avoir une description un peu unifiée des jeux de données, et nous avons vu également que ces éléments étaient utilisés en particulier dans les infrastructures nationales de données, les géoportails nationaux en France, en Belgique, en Suisse, pour décrire les jeux de données mis à disposition. [MUSIQUE]