Initiative pour les Données de la Planète
Initiative pour les Données de la Planète
L'Initiative pour les Données de la Planète (IDP) est le nom arbitraire et provisoire d'un faisceaux de projets catalysés par l'Institut Angénius dans le cadre de sa mission de promotion du calcul de l'empreinte écologique.
Ce vaste multi-projet regroupe des aspects :
- (a) Techniques
par la mise en place d'une solution logicielle de définition et de traitement de données. (Datana)
- (b) Scientifiques
par la spécification de normes d'encodage du savoir par des réseaux d'experts. (Réseau d'Excellence)
- (c) Environnemental
par l'application immédiate de la combinaison des solutions techniques et scientifiques à des situations réélles (SITA)
- (d) Communautaires (a plus long terme)
dans la mise en place de réseaux automatisés de circulation de l'information (Planet Data Initiative)
(a) Plateforme technique : Datana
Datana
Datana est le nom du projet logiciel consistant à remplir des besoins :
- 1: de modélisation de la connaissance sur les données et leurs interactions et contraintes
- 2: de conception et d'echange de savoir, sous forme d'ontologies légitimées par des réseaux d'experts.
- 3: de traitement de flux de données, selon des modèles d'agglomération et d'acheminement configurables
- 4: de modules de représentation réutilisables pour diversifier les possibilités de visualisation et de compréhension des flux de données.
(a) Vue d'ensemble Datana
Schéma Datana
1: Modélisation de connaissance
Datana: Modélisation de la connaissance
Le propos du modèle est d'être exploitable par des systèmes informatiques tout en restant lisibles par l'être humain.
- codification et échanges de modèles au format RDF (voir web sémantique)
- Usage d'ontologies existantes déjà publiées (par exemple SWEET)
- publication d'ontologies statistiques et algorythmiques (non existantes à ce jour).
- publication d'ontologies spécialisée (ontologies de l'empreinte écologique par exemple).
- validation de flux de données donnant lieu à calcul d'un indice utilisé dans les ontologies statistiques ou spécialisées, certification de son origine et de sa pertinence.
2: Formalisation du savoir
Datana: Formalisation du savoir
- interface de combinaison des savoirs disponibles en banque de connaissance pour correspondre à des flux existants.
- ecriture de scénarii à des fins prospectives.
- usage collaboratif de l'outil d'édition, possible ecriture collective du savoir, des usages et des indices.
- interopérable : les formulation de savoir sont publiables en RDF en public ou à un réseau choisi.
3: Traitement des flux
Datana: Traitement des flux
Comprend:
- un outil de modélisation de flux
- des protocoles de communication
- différents systèmes de stockage de données (stockage exhaustif, historisation, stockage sur vis sans fin)
- une boite à outils pour s'adapter à des systèmes de collecte de données déjà existants.
- une capacité à publier des indices utilisables par des ontologies.
4: Représentations statistiques
Datana: Représentations statistiques
- Utilisation de librairies existantes pour un large choix de représentations
- export au formats texte répandus (.csv, .xsl, .xhtml, ...)
- rendu sous forme de graphiques statiques (jpgraph)
- rendu sous forme vectorielle interactive (SVG)
- animation en flash sur une perdiode donnée (amfphp, ming)
- rendu 3d interactif (morcego: représentation 3d d'objets liés)
- représentation cartographiques (mapserver)
- interface de modélisation de rapport statistique
- rendu en fonction de périodes, ou dynamiques au jour le jour.
- possibilité de projection d'evolution de flux de données (prospective)
- alternative à powerpoint et autres outils bureautiques
- usage de code source tiré d'outils connus en administration système et réseaux (par exemple http://cacti.net)
- capacité d'inclusion dans des systèmes de publication existants.
(b) Réseaux d'excellence
Réseaux d'excellence
Principes
- attractivité de l'agglomération d'expertise (nécessité d'un premier contributeur significatif et/ou reconnu)
- charte de libre usage du savoir indivisible : la capitalisation du savoir humain ne peut preter à spéculation économique de type industriel.
- délimitation thématique : validation de la structure du réseau sur le Réseau d'Excellence de l'empreinte ecologique.
Avantages:
- Légitimation des modèles de données et des sources d'indices.
- Pretexte transversal de recoupement d'informations par metier.
- capitalisation de savoir non marchand publiquement accessible.
(c) Application pilote
Projet SITA, application pilote
Projet SITA de calcul de l'empreinte écologique de la collecte des déchets.
- Des flux de données déjà existants (GPS sur les transports, pesées,..)
- différents systèmes d'information déjà en exploitation
- intervention d'acteurs variés sur un modèle collaboratif et plannification pluri-annuelle.
(d) Démarche communautaire
Démarche communautaire
Principes de diffusion de pair a pair (p2p) des modèles, flux de données et gabarits de représentations.
- décentralisation de l'information naturelle.
- systèmes de cache rénamants : sauvegarde par duplication (principe des DNS)
- interoperabilité de Datana avec des systèmes d'information existant sous licence libre perenne, sous forme de modules dédiés par application.
- participation directe des données terrain à la construction aval d'indices stratégiques.
Plannification
Paris de planification
Quelques dates prévisionnelles, non définitives :
- Inventaire et spécifications RDF : 06-09 / 2005
- développement d'un squelette applicatif Datana : 06-09 / 2005
- Formalisation d'une charte de diffusion du savoir au sein du Réseau d'Excellence : 06-07 / 2005
- Préparation et validation des modèles par rapport aux flux de données SITA : 06-08 / 2005
- Implementation d'une première version en test sur le pilote SITA : 09-10 / 2005
- Diffusion publique du code source Datana : 06 / 2005 (en fait tout le développement sera public)
- Première Publication officielle de Datana : 10 / 2005
Points de repères
Points de repères