Feeds:
Articles
Commentaires

Posts Tagged ‘savoir’

Le Web sémantique désigne un ensemble de technologies visant à rendre les ressources du Web accessibles et utilisables par les programmes, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C. C’est un cadre commun qui permet le partage de données au-delà des frontières entre applications et communautés. C’est un effort collaboratif mené par un grand nombre de chercheurs et de partenaires socio-économiques. Il se fonde sur le cadre fourni par le « Resource Description Framework (RDF) ». Le Web sémantique, en tant que projet et programme, répond à deux types de préoccupations. Il s’agit d’abord de construire des formats communs, propres à l’intégration de données de diverses sources et à l’échange des documents. Il s’agit aussi d’élaborer un langage rendant compte de la relation entre ces données et les objets du monde réel, et permettant donc de « circuler » dans des ensembles de bases de données.

C’est dans ce contexte que Tim Berners Lee proposa dès 1994, la notion de « métadonnées » utilisables par les machines, lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles depuis, sont présentées comme une représentation utilisable par les machines de l’information contenue dans les documents, par exemple le fait qu’une personne X est employée par une organisation Y.

Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework), langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web.

Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF conçu pour décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d’ontologie OWL, publiés dans leur forme finale en février 2004.

Au cours de cette évolution, la notion de ressource a quitté son sens original de « document publié sur le Web » pour s’étendre à des sens plus généraux et plus abstraits. Dans les langages d’ontologie, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l’indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l’environnement Web, et permettant de transformer automatiquement les données en information, et les informations en savoirs.

Le Web sémantique s’appuie donc sur la fonction primaire du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.), mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

* générer des données sémantiques à partir de la saisie d’information par les utilisateurs ;
* agréger des données sémantiques afin d’être publiées ou traitées ;
* échanger automatiquement des données en fonction de leurs relations sémantiques ;
* générer des données sémantiques automatiquement, à partir de règles d’inférences.

Cela implique en premier lieu de s’interroger sur les principes de classification à l’œuvre aussi bien dans les savoirs humains que dans le Web. Des millions de documents sont en effet, « installés » sur le Web. Mais l’accessibilité à ces documents n’est que partielle. Un moteur de recherche usuel permet un accès non sémantique.

Un accès « sémantique » sera réalisé lorsque les mots entrés par l’internaute dans son moteur de recherche seront décodés en termes de sens puis reliés à des documents eux mêmes indexés selon leur sens, grâce à des marqueurs spéciaux dans les pages Web (« balises » permettant de relier les pages). C’est ce que l’on nomme le « Web sémantique » comme on vient de le voir. Pour ce faire, comme cela a été dit précédemment, il faut développer un langage de traitement/classification sémantique par exemple à base d’ontologie.

Une classification ou système de classification est un système organisé et hiérarchisé de classification d’«objets ». Les classifications sont utilisées dans tous les domaines d’activités humaines (les espèces vivantes, les maladies, les produits ou services, les documents dans une bibliothèque…). Les classifications portant sur un domaine limité sont généralement bien admises par les spécialistes du domaine. Les classifications à vocation universelle, en revanche, sont toujours tributaires d’un point de vue et sont donc l’objet de nombreuses critiques. Elles apportent cependant un éclairage utile aux réflexions sur la nature de la connaissance et les processus cognitifs mis en jeu.

Les classifications sont donc importantes pour organiser les connaissances. Classer les objets ou les connaissances, c’est dire comment ils/elles se situent les un(e)s par rapport aux autres.

Maintenant que l’ouvrage « Tendances » est paru, il nous a paru pertinent à Pierre Fraser et moi-même, de tenter une aventure commune sur la notion de « Web sémantique ». Elle prendra l’allure de fragments écrits, échangés entre nous deux, avec des fils conducteurs !
L’idéal est une sorte de blog que l’on ouvrira à d’autres ! Le fil conducteur général pourrait suivre, dans l’immédiat, les étapes d’interrogation suivantes :

– Le web sémantique ? Classer, penser. Penser, classer.
– La tradition du classement ? Idées éternelles, idées opportunes ? Depuis le conflit Platon-Aristote…
– Le statut des objets : quelles entités ? comment classer ? La « forêt des taxinomies »…
– Les relations : le langage et la réalité ?
– Le lecteur comme constructeur de parcours. Chemins de la connaissance ?
– Le Web, lieu de navigation ? Comment s’y perdre ? Comment s’y retrouver ? Quels processus ?
– Le Web univers ? Paradis ou enfer ? Un océan de données : s’y noyer ? Quelles balises ? Quels repères ?
– Des routes à tracer : l’avenir n’est pas à savoir classer, mais à savoir relier: de nouvelles compétences ?

Read Full Post »