RSS Datana : Data Analyser

print
Initiative pour les Données de la Planète

Initiative pour les Données de la Planète


L'Initiative pour les Données de la Planète (IDP) est le nom arbitraire et provisoire d'un faisceaux de projets catalysés par l'Institut Angénius dans le cadre de sa mission de promotion du calcul de l'empreinte écologique.

Ce vaste multi-projet regroupe des aspects :

  • (a) Techniques
    par la mise en place d'une solution logicielle de définition et de traitement de données. (Datana)

  • (b) Scientifiques
    par la spécification de normes d'encodage du savoir par des réseaux d'experts. (Réseau d'Excellence)

  • (c) Environnemental
    par l'application immédiate de la combinaison des solutions techniques et scientifiques à des situations réélles (SITA)

  • (d) Communautaires (a plus long terme)
    dans la mise en place de réseaux automatisés de circulation de l'information (Planet Data Initiative)

(a) Plateforme technique : Datana

Datana


Datana est le nom du projet logiciel consistant à remplir des besoins :

  • 1: de modélisation de la connaissance sur les données et leurs interactions et contraintes

  • 2: de conception et d'echange de savoir, sous forme d'ontologies légitimées par des réseaux d'experts.

  • 3: de traitement de flux de données, selon des modèles d'agglomération et d'acheminement configurables

  • 4: de modules de représentation réutilisables pour diversifier les possibilités de visualisation et de compréhension des flux de données.

(a) Vue d'ensemble Datana

Schéma Datana


click to edit


1: Modélisation de connaissance

Datana: Modélisation de la connaissance


Le propos du modèle est d'être exploitable par des systèmes informatiques tout en restant lisibles par l'être humain.

  • codification et échanges de modèles au format RDF (voir web sémantique)

  • Usage d'ontologies existantes déjà publiées (par exemple SWEET)

  • publication d'ontologies statistiques et algorythmiques (non existantes à ce jour).

  • publication d'ontologies spécialisée (ontologies de l'empreinte écologique par exemple).

  • validation de flux de données donnant lieu à calcul d'un indice utilisé dans les ontologies statistiques ou spécialisées, certification de son origine et de sa pertinence.

2: Formalisation du savoir

Datana: Formalisation du savoir


  • interface de combinaison des savoirs disponibles en banque de connaissance pour correspondre à des flux existants.

  • ecriture de scénarii à des fins prospectives.

  • usage collaboratif de l'outil d'édition, possible ecriture collective du savoir, des usages et des indices.

  • interopérable : les formulation de savoir sont publiables en RDF en public ou à un réseau choisi.

3: Traitement des flux

Datana: Traitement des flux


Comprend:

  • un outil de modélisation de flux

  • des protocoles de communication

  • différents systèmes de stockage de données (stockage exhaustif, historisation, stockage sur vis sans fin)

  • une boite à outils pour s'adapter à des systèmes de collecte de données déjà existants.

  • une capacité à publier des indices utilisables par des ontologies.

4: Représentations statistiques

Datana: Représentations statistiques


  • Utilisation de librairies existantes pour un large choix de représentations
    • export au formats texte répandus (.csv, .xsl, .xhtml, ...)
    • rendu sous forme de graphiques statiques (jpgraph)
    • rendu sous forme vectorielle interactive (SVG)
    • animation en flash sur une perdiode donnée (amfphp, ming)
    • rendu 3d interactif (morcego: représentation 3d d'objets liés)
    • représentation cartographiques (mapserver)

  • interface de modélisation de rapport statistique
    • rendu en fonction de périodes, ou dynamiques au jour le jour.
    • possibilité de projection d'evolution de flux de données (prospective)
    • alternative à powerpoint et autres outils bureautiques

  • usage de code source tiré d'outils connus en administration système et réseaux (par exemple http://cacti.net)external link

  • capacité d'inclusion dans des systèmes de publication existants.

(b) Réseaux d'excellence

Réseaux d'excellence


Principes

  • attractivité de l'agglomération d'expertise (nécessité d'un premier contributeur significatif et/ou reconnu)

  • charte de libre usage du savoir indivisible : la capitalisation du savoir humain ne peut preter à spéculation économique de type industriel.

  • délimitation thématique : validation de la structure du réseau sur le Réseau d'Excellence de l'empreinte ecologique.


Avantages:

  • Légitimation des modèles de données et des sources d'indices.

  • Pretexte transversal de recoupement d'informations par metier.

  • capitalisation de savoir non marchand publiquement accessible.




(c) Application pilote

Projet SITA, application pilote


Projet SITA de calcul de l'empreinte écologique de la collecte des déchets.

  • Des flux de données déjà existants (GPS sur les transports, pesées,..)

  • différents systèmes d'information déjà en exploitation

  • intervention d'acteurs variés sur un modèle collaboratif et plannification pluri-annuelle.




(d) Démarche communautaire

Démarche communautaire


Principes de diffusion de pair a pair (p2p) des modèles, flux de données et gabarits de représentations.

  • décentralisation de l'information naturelle.

  • systèmes de cache rénamants : sauvegarde par duplication (principe des DNS)

  • interoperabilité de Datana avec des systèmes d'information existant sous licence libre perenne, sous forme de modules dédiés par application.

  • participation directe des données terrain à la construction aval d'indices stratégiques.

Plannification

Paris de planification


Quelques dates prévisionnelles, non définitives :

  • Inventaire et spécifications RDF : 06-09 / 2005

  • développement d'un squelette applicatif Datana : 06-09 / 2005

  • Formalisation d'une charte de diffusion du savoir au sein du Réseau d'Excellence : 06-07 / 2005

  • Préparation et validation des modèles par rapport aux flux de données SITA : 06-08 / 2005

  • Implementation d'une première version en test sur le pilote SITA : 09-10 / 2005

  • Diffusion publique du code source Datana : 06 / 2005 (en fait tout le développement sera public)

  • Première Publication officielle de Datana : 10 / 2005

Points de repères

Points de repères






Contributors to this page: mose , Johan , Stéphane and admin .
Page last modified on Saturday 02 July, 2005 [23:59:17 UTC] by mose.

Search
in:
Credits : ...
[ Execution time: 0.26 secs ]   [ Memory usage: 1.26MB ]   [ 113 database queries used ]   [ GZIP Enabled ]   [ Server load: 0.93 ]
Last update from CVS: Sunday 02 March, 2008 [11:53:28 UTC]