Base de connaissances et ontologie photo : Pose partage à l'ère du Web sémantique

Le 27 juillet 2011

En 2008, lors d'une expérimentation menée dans le cadre de travaux de recherche en ingénierie des connaissances à l'université de Picardie, une base de connaissances de la photographie avait été créée pour le site Photo facile, ancêtre de Pose partage. Aujourd'hui, Pose partage intègre une nouvelle version de cette BDC pour étendre ses fonctionnalités !

Qu'est-ce qu'une base de connaissances ?

Une base de connaissances (BDC) est une description, plus ou moins formelle, plus ou moins complète, de l'ensemble des connaissances relatives à un domaine. Par exemple, le domaine de la photographie fait intervenir bon nombre de connaissances que les photographes acquièrent et manipulent au cours de leur pratique de la discipline : ces connaissances peuvent être modélisées et répertoriées dans une BDC. Un reflex numérique est un reflex. Un reflex numérique est un appareil photo numérique.

La citation ci-dessus représente des connaissances que l'on retrouve dans une base de connaissances de la photographie !

Bases de connaissances et ontologies

Ontologie, réseau sémantique

Les systèmes informatiques manipulent des données, comme des caractères, des nombres, et beaucoup d'autres choses qui n'ont pas beaucoup de sens pour nous autres humains quand elles sont sorties de leur contexte.

Pour bâtir des systèmes utiles et performants, mais aussi simples et accessibles, une idée consiste à essayer d'expliciter ces connaissances manipulées implicitement par les ordinateurs et leurs programmes. Mais pour cela, il est nécessaire de disposer de descriptions précises des connaissances : c'est là qu'interviennent les ontologies.

Les ingénieurs de la connaissance définissent une ontologie comme « la spécification partagée d'une conceptualisation ». En gros, l'idée est de rassembler les connaissances dont on dispose sur un domaine (notez que cette notion d'ontologie est différente de celle rencontrée en philosophie, même si elle en tire une partie de ses propriétés), dans un modèle. On parle parfois de réseau sémantique. L'ontologie est généralement un élément central de la base de connaissance : c'est la description générale du domaine, à laquelle vont se référer toutes les connaissances manipulées par le système ! Puisque l'on fait de l'informatique, l'ontologie sera formalisée, au bout du compte, avec des langages informatiques : OWL, RDF, graphes conceptuels, etc. Néanmoins, on peut déjà parler d'ontologie à propos d'une conceptualisation non formelle (voire semi-informelle). À titre d'illustration, voici deux personnes en train de constituer ce qui est, déjà, une ontologie (on dit parfois qu'ils « ontologisent »):

Ontologie et ontologisation
Un exemple d'ontologie informelle, conceptualisation partagée par deux personnes d'une communauté (processus d'ontologisation)

À quoi ça sert, tout ça ?

À ce stade de la lecture, vous vous demandez peut être ce que tout ce charabia a à voir avec notre site et forum photo, et à quoi ces ontologies et bases de connaissances vont bien pouvoir nous être utiles ?

Catégoriser, c'est compliqué !

Le forum Pose partage, comme tous les fora, propose une classification des fils de discussion dans des rubriques (ex. : « La photo du jour », « Paysage », etc.), elles-même rangées dans des catégories (« Vos photos », « Matériel »…).

Néanmoins, la frustration est souvent grande quand on souhaite poster un message ou un reportage qui ne trouve sa place, a priori, dans aucune des rubriques proposées. Imaginez un instant la tête déconfite d'un Levarwest triste comme un menhir à l'idée de devoir reléguer toutes ses photos de studio dans la rubrique « Inclassable ». Trois solutions se présentent alors à nous :

  1. On se dit qu'après tout on s'en moque, et que les gens n'ont qu'à mettre leurs fils dans la rubrique « Inclassable ».
  2. À chaque fois que la nécessité se présente, on crée une nouvelle rubrique jusqu'à faire exploser la page d'accueil du forum.
  3. On crée un système de catégorisation transverse. J'ai choisi la troisième possibilité !

Un système de catégorisation évolué

Notre base de connaissances et son ontologie de la photographie nous ont permis de proposer une solution efficace à ce problème de catégorisation, qui consiste à garder les rubriques originales (elles avaient été choisies avec minutie par l'équipe de modération et avaient un sens), en ajoutant la possibilité pour un fil de discussion de faire référence à un concept de la base de connaissance. Une sorte de système de tagging évolué !

« Ouais, les tags c'est pas nouveaux », répondront certains. Certes, bien avant que des gens s'agitent sur les problématiques de folksonomies, beaucoup de bloggers avaient sur leurs pages un système permettant d'apposer des tags sur un article ou une ressource.

Mais la vision « Ingénierie des connaissances » nous permet d'aller plus loin que de simples tags, comme l'ont compris plusieurs projets intéressants comme SIOC Core Ontology ou encore le Simple Knowledge Organization System. En effet, n'oublions pas que les connaissances de notre ontologie sont bien formalisées et décrivent précisément le domaine de la photo. La base de connaissances Pose partage décrit par exemple le fait qu'une pellicule est un dispositif de stockage de photos qui a pour sensibilité une sensibilité ISO argentique, elle même « subsumée par » (c'est à dire qu'elle spécialise ou étend) la notion de sensibilité ISO. Si un fil de discussion a pour sujet « pellicule », alors on sait que ce fil a aussi pour sujet « dispositif de stockage de photos » ! Il est donc à présent possible d'afficher tous les fils de discussion ayant pour sujet, par exemple, « Studio photo ». Notez que la liste proposée comprend aussi les fils ayant pour sujet les concepts « descendant » (ses fils, petit-fils, etc.) de ce concept : « Home-studio photo » en fait partie !

Recherche de fils par tag
Recherche de fils de discussion par sujet, de manière transverse aux rubriques

Il vous est alors possible de créer directement un fil de discussion ayant, lui aussi, pour sujet « Studio photo », en cliquant sur le bouton « Créer un nouveau fil de discussion sur ce thème ».

Une navigation suggestive : découvrir le domaine de la photo

À partir de la page d'accueil du forum, d'une page thématique ou d'un fil de discussion faisant référence à un concept de l'ontologie, il est désormais possible de naviguer, graphiquement, dans la base de connaissances !

Vous cherchiez des informations sur la macrophotographie ? En parcourant la base de connaissances, vous découvrirez peut être que la photomicrographie est une spécialisation de la macrophoto, et vous trouverez peut être des messages sur le forum qui vous expliqueront comment cela fonctionne !

Base de connaissances, catégories transverses
Les nouvelles catégories transverses du forum photo

Et beaucoup d'autres applications à venir…

Dans le cadre du Web sémantique (un Web accessible aux hommes et aux machines, permettant de trouver plus facilement ce que l'on recherche vraiment), Pose partage expose dès à présent des métadonnées et des descriptions RDF accessibles par certains moteurs. Bientôt, ces descriptions tireront mieux parti de la BDC, et seront plus pertinentes, notamment en intégrant certaines propriétés de SKOS et des microformats.

Le moteur de recherche du site, récemment amélioré, propose déjà de trouver des photographes, des fils de discussion, du matériel, des articles de blogs, et beaucoup d'autres choses. Bientôt couplé à la base de connaissances, il vous permettra de réaliser des requêtes encore plus fines !