Virtual database / Base de données virtuelles

Dans le cadre d'une dizaine d'opérations de recherche en SHS, l’ISH a élaboré et mis en place un système d’information reconfigurable (Virtual database) pour l’exploitation via le web de corpus multimédia (textes, images, vidéo, carte, etc.).
A partir d’un système unique, il nous est possible d’exploiter diverses sources de données tout en correspondant, pour l'utilisateur, à de multiples frontales web distinctes. Le système contient actuellement plus 30 000 documents (images, textes, cartes, etc.) avec leurs notices, auxquelles s’ajoutent 38 000 autres données informatives (biographie, géolocalisation, informations quantitatives, etc.).

Ce système est actuellement utilisé pour les sites suivants :

Projets de recherche (3)

Sites institutionnels (2)

Philosophie du système

VDB (Virtual Database) est un système d’information polymorphe1 utilisé à l’ISH pour la réalisation des diverses frontales Web. La caractéristique principale de ce système est d'accepter des opérations de reconfiguration en temps réel. Suivant la classification des machines de Hartenstein (2006)2, VDB appartient à la classe des morphware, machines qui peuvent se décliner de façon logicielle ou matérielle.

Un des principaux intérêts de ce paradigme est de centrer le design du système sur les questions d’adaptabilité plutôt que sur les opérations de traitement, la conformation à un schéma de conception, ou à une ontologie. Ce dernier point est essentiel, car si l’importance de l’ontologie en informatique est reconnue, l’ontologie pose avant tout la question de l’existence des objets. Or dans un système reconfigurable ou polymorphe, la notion d’existence est relative à l’espace de contrainte qui définit les conditions de sa réalisation de façon dynamique.

Une telle approche de l’information s'avère fort pratique dans la production des systèmes, car de cette conception découlent les propriétés suivantes :

  • Réutilisation d’une même information dans divers contextes.
  • Modularité de l’accès suivant le niveau d’authentification de l’utilisateur
  • Schéma de conception unique quelle que soit l’information : donnée de type texte, image, vidéo, cartographie, etc.
  • Utilisation d’un code unique de programmation
  • Auto délimitation du code, par niveau d’authentification et contexte d’utilisation.

Mais la propriété principale du système est de pouvoir se centrer sur la pratique des chercheurs, tant que ceux-ci ont une vision un peu formaliste de leur source de données.

En effet, dans VDB aucun élément n’étant figé ou lié à un schéma de conception ou à un cahier des charges, il est facile de redéfinir le système, d’en isoler une sous-partie, de lui ajouter des fonctions supplémentaires. En ceci, ce système est compatible avec la philosophie générale de MPEG-21 et du Memex (Vannevar Bush, 1945, As We May Think).

Dans le cadre de MPEG-21, l’idée principale est d’aller au-delà d’un schéma descendant de l’information qui irait du producteur à un consommateur. Pour cela, le système doit être placé au centre des divers acteurs, et leur permettre seulement d’en utiliser une sous-partie, mais aussi de concevoir un autre système à partir de ses éléments.

Dans le cadre du Memex, l’idée principale est de concevoir les systèmes d’information comme une extension des capacités cognitives, offrant la possibilité d’emmagasiner une importante somme de connaissance, mais aussi d’en extraire de nouvelle forme de relation. Si l’on a beaucoup critiqué V. Bush sur sa vision limitée de l’association et de la relation, il faut bien voir que sa conception est liée à une théorie cognitive de la pensée. Or, jusqu'à aujourd'hui, personne n’a réalisé un système qui satisfait cette condition. A défaut de pouvoir réaliser un tel système, on peut centrer les efforts sur l’adaptation des systèmes aux représentions et attentes des utilisateurs, ce qui est le but principal à poursuivre pour développer les systèmes d’informations de l’ISH.

Éléments statistiques des frontales web (février 2008)

Nombre de visiteurs pour tous les sites par jour 2 300 (moyenne par site 210)

Nombre de documents : 30 300

  • dont images : 28 317
  • dont cartes : 301
  • dont textes : 201
  • dont journaux : 1 459
  • dont vidéos : 13

Nombre de notices d’informations : 36 559
Nombre de notices bibliograhiques : 2 155

Équipe

Auteur

Gérald Foliot : Core system

Contributeurs

Frédéric Dussurget : module images et vidéos

Hélène Kieffer : numérisation, saisie des informations

Anciens contributeurs

Raphaël Tournoy : module d’édition, consolidation du code

Martial Tola : modules images



1 Pour plus d'information on peut se reporter au brevet 7003524 (US Patent), au slide "Polymorhpic Database Design", ainsi qu'à l'article "Federated Database" sur wikipedia (en).

2 Hartenstein, R. W. (2006). Morphware and Configware. In Zomaya, A. (Ed.), Handbook of Innovative Computing Paradigms. Heidelberg/New-York: Springer-Verlag.

 

... un site de ressources de l'Institut des Sciences de l'Homme (CNRS / ENS-Lyon / Université Lyon 2)