Stéphane Traumat

Stéphane Traumat

CEO @ Scub
-

Angoulême

,

France

“Changer ce que l'on peut changer & accepter ce qui ne peut l'être”

Introduction au web sémantique

Scub commence à s’intéresser au web sémantique, voici un petit article qui fait un résumé de ce que nous avons compris pour le moment… Ce n’est pas forcément complètement exact mais nous débutons !

Aujourd’hui, le web est constitué d’informations écrites dans un langage naturel (français, anglais, espagnol…). Ces informations peuvent être facilement traitées par les humains car nous pouvons déduire des faits et créer des associations à partir de ce que nous lisons. Le problème, c’est que les machines, elles, ne peuvent pas utiliser d’informations partielles, elles ne peuvent pas comprendre une image et elles sont incapables de faire des analogies.

Le web sémantique, c’est un ensemble de technologies qui ont pour but de rendre les ressources du web utilisable par des machines (c’est à dire des applications/logiciels/agents..). L’idée, c’est de rajouter des informations sur les informations elles mêmes (méta données).

Voici un exemple RDFa tiré de Wikipedia :

<p xmlns:dc="http://purl.org/dc/elements/1.1/"
 about="http://www.example.com/books/wikinomics">
 Dans son dernier livre <em property="dc:title">Wikinomics</em>, <span property="dc:author">Don Tapscott</span> explique les profonds changements technologiques, démographiques et économiques.
Ce livre a été publié en <span property="dc:date" content="2006-10-01">octobre 2006</span>.
</p>

Les attributs « property » vont permettre à un logiciel de savoir que Wikinomics est le titre du livre et que Don Tapscott en est l’auteur. A partir de cela, un programme pourra, par exemple, aller chercher sur Amazon tous les commentaires sur ce livre ou la liste des livres écrits par cet auteur.

Un autre exemple d’utilisation est FOAF. Grâce à ce standard, vous allez pouvoir décrire qui vous êtes, vos coordonnés, votre environnement, vos connaissances…

Voici une description minimale de qui je suis avec ce format :

<rdf:RDF
xmlns:rdf= »http://www.w3.org/1999/02/22-rdf-syntax-ns# »
xmlns:rdfs= »http://www.w3.org/2000/01/rdf-schema# »
xmlns:foaf= »http://xmlns.com/foaf/0.1/ »
xmlns:admin= »http://webns.net/mvcb/ »>
<foaf:PersonalProfileDocument rdf:about= »">
<foaf:maker rdf:resource= »#me »/>
<foaf:primaryTopic rdf:resource= »#me »/>
<admin:generatorAgent rdf:resource= »http://www.ldodds.com/foaf/foaf-a-matic »/>
<admin:errorReportsTo rdf:resource= »mailto:leigh@ldodds.com »/>
</foaf:PersonalProfileDocument>
<foaf:Person rdf:ID= »me »>
<foaf:name>Stéphane Traumat</foaf:name>
<foaf:givenname>Stéphane</foaf:givenname>
<foaf:family_name>Traumat</foaf:family_name>
<foaf:mbox_sha1sum>5fe07f0c181cc93ce73173936a686f8df9d180ee</foaf:mbox_sha1sum></foaf:Person>
</rdf:RDF>

En mettant ce code sur notre blog, un robot pourrait très bien découvrir qui je suis, parcourir mes relations, trouver des personnes que je connais ou aller rechercher des informations sur moi.

Aujourd’hui, si je veux connaitre le numéro de portable d’une personne, je vais sur google et je cherche « numéro portable Yves Dupont », google va « bêtement » rechercher les pages où se trouvent les mots que j’ai demandé. Avec ces technologies, on pourrait très bien avoir un moteur de recherche à qui l’on demande : « Quel est le numéro de portable de Yves Dupont ? », le moteur de recherche comprendrait ce que nous voulons et nous ferait une réponse exact en utilisant les fichiers FOAF qu’il aurait trouvé sur le net.

Dernière chose intéressante, l’annonce de Google qui date de lundi : http://googlewebmastercentral.blogspot.com/2009/10/help-us-make-web-better-update-on-rich.html. Ils annoncent notamment outil qui permet de voir ce que google extrait comme méta données d’une page web : Exemple linkedin

Il est clair que dans un futur proche, google s’appuiera de plus en plus sur ces technologies afin de comprendre au mieux le contenu des pages, il va donc falloir repenser la construction du contenu web et surtout penser à sa description !

Merci beaucoup à Wikipedia et à Fred Cavazza pour les infos ! :)