Flux
Articles
Commentaires

Les ontologies


Le développement des ontologies – spécifications formelles de termes d’un domaine et de relations entre elles[1] et formes modernes de la catégorisation – a quitté le champ de l’Intelligence Artificielle pour gagner les postes informatiques des experts de domaines. Les ontologies sont devenues courantes dans le World-Wide Web. Le champ de ces ontologies varie de taxonomies larges servant à catégoriser les sites Web (tels que dans Yahoo!) aux catégorisations de produits destinés à la vente et de leurs caractéristiques (tel que dans Amazon.com). Le Defence Advances Research Projects Agency (DARPA), conjointement avec le W3C, développe actuellement le DARPA Agent Markup Language (DAML) en vue de procurer  des ontologies normalisées utilisables par les experts de domaines pour partager et commenter l’information dans leurs domaines. La médecine par exemple, a produit de vastes vocabulaires normalisés structurés tels que SNOMED[2] et le réseau sémantique du Unified Medical Language System.[3] De même apparaissent de grandes ontologies universelles : par exemple le Programme des Nations Unies pour le développement et Dun & Bradstreet ont unis leurs efforts pour développer l’ontologie UNSPSC qui fournit une terminologie pour les produits et les services.

Une ontologie définit un vocabulaire commun pour les chercheurs qui ont besoin de partager l’information dans un domaine.[4] Elle inclut des définitions lisibles en machine des concepts de base de ce domaine et de leurs relations. Une ontologie sert notamment à :

- Partager la compréhension commune de la structure de l’information entre les personnes ou les fabricants de logiciels.

- Analyser le savoir sur un domaine.

- Permettre la réutilisation du savoir sur un domaine : c’était une des raisons majeures qui ont poussé la recherche sur les ontologies. Par exemple, les modèles de plusieurs domaines ont eu besoin de représenter la notion de temps. Cette représentation comprend les notions d’intervalles de temps, de moments précis de temps, de mesures relatives de temps, etc.

- On peut, également, réutiliser une ontologie générale tel que le UNSPSC et l’étendre pour permettre de décrire un domaine d’intérêt spécifique.

- Distinguer le savoir sur un domaine du savoir opérationnel est une autre des finalités courantes desontologies. Nous pouvons décrire la tâche de configuration d’un produit à partir de ses constituants, en respectant les spécifications requises et implémenter un programme qui réalisera cette configuration indépendamment des produits et de leurs composants.  On peut ainsi développer une ontologie des parties composantes et des caractéristiques d’un PC et appliquer l’algorithme pour configurer des PC sur mesure.

Analyser le savoir sur un domaine est possible dès que la spécification des termes du domaine est faite. L’analyse formelle des termes est extrêmement précieuse aussi bien quand on veut réutiliser les ontologies existantes, que quand on veut les étendre.[5] Souvent une ontologie de domaine n’est pas toujours un but en soi. Développer une ontologie s’apparente à définir un ensemble de données et leur structure pour qu’elles soient utilisées par d’autres programmes. Les ontologies et les bases de connaissances élaborées à partir des ontologies sont utilisées comme données par les méthodes de solutions de problèmes, les applications indépendantes des domaines et les fabricants de logiciels. Par exemple, Natalya F. Noy et Deborah L. McGuinness ont développé une ontologie sur le vin, les mets et les alliances appropriées des vins et des plats.[6] Cette ontologie peut être utilisée comme base pour toute une série d’applications visant le management des restaurants.  L’exemple du vin et des mets est inspiré d’un exemple de base de connaissances présenté dans un article décrivant CLASSIC – un système de représentation de connaissances basé sur une approche de description-logique (Brachman et al. 1991).

Qu’est une ontologie ?

On dira qu’une ontologie est une description formelle explicite des concepts dans un domaine du discours (classes (appelées parfois concepts)), des propriétés de chaque concept décrivant des caractéristiques et attributs du concept : attributs (appelés parfois rôles ou propriétés)) et des restrictions sur les attributs (facettes (appelées parfois restrictions de rôles)). Une ontologie ainsi que l’ensemble des instances individuelles des classes constituent une base de connaissances.

Les classes décrivent les concepts dans le domaine. Par exemple une classe de vins représente tous les vins. Les vins spécifiques sont des instances de cette classe. Ainsi, on peut diviser la classe de tous les vins en vins rouges, blancs et rosés. Alternativement, nous pouvons diviser une classe de tous les vins en effervescents et non effervescents. Les attributs décrivent les propriétés des classes et des instances: le vin Château Lafite Rothschild Pauillac est un vin charpenté ; il est produit par l’établissement vinicole de Château Lafite Rothschild. Nous avons deux attributs décrivant le vin dans cet exemple : l’attribut corps ayant pour valeur charpenté et l’attribut producteur ayant pour valeur établissement vinicole Château Lafite Rothschild. Au niveau de la classe, on peut dire que les instances dela classe Vin auront des attributs décrivant leur odeur, leur corps, leur niveau de sucre, le

producteur du vin et ainsi de suite.

En termes pratiques, développer une ontologie implique donc de :

- définir les classes dans l’ontologie,

- arranger les classes en une hiérarchie taxinomique (sous-classe – super-classe),

- définir les attributs et décrire les valeurs autorisées pour ces attributs

- renseigner les valeurs pour les attributs des instances

Une simple méthodologie de génie cognitif

Le développement d’une ontologie est nécessairement un processus itératif. Les concepts dans une ontologie doivent être très proches des objets (physiques ou logiques) et des relations dans un domaine d’intérêt. Fort probablement ils sont des noms (objets) ou verbes (relations) dans des phrases qui décrivent un domaine. Il faut également se rappeler qu’une ontologie est un modèle de la “réalité” du monde et que les concepts dans l’ontologie doivent refléter cette réalité.

Etape 1

Quel est le domaine que va couvrir l’ontologie ? A quels types de questions l’ontologie devra-t-elle fournir des réponses ? Qui va utiliser et maintenir l’ontologie ? Naturellement, les concepts qui décrivent les différents types de vins, les types de mets, la notion d’une bonne alliance d’un vin et d’un plat ainsi que celle d’une mauvaise alliance figureront dans une ontologie des vins.  Si l’ontologie est destinée à aider les clients des restaurants à décider quel vin commander, nous aurons besoin d’utiliser des informations sur les prix de vente au détail. Si elle est utilisée par les grossistes en vin, des informations sur la disponibilité de la marchandise peuvent être nécessaires.

Une des méthodes pour déterminer la portée d’une ontologie est de rédiger une liste de questions auxquelles une base de connaissances fondée sur une ontologie devrait pouvoir répondre, appelées questions de compétence.[7] Elles serviront plus tard de test décisif.

Voici quelques questions de compétence possibles dans le domaine du vin et des mets :

- Sur quelles caractéristiques dois-je me fonder pour choisir un vin ?

- Un Cabernet Sauvignon peut-il accompagner les plats de fruits de mer ou de poissons ?

- Quel serait le meilleur vin pour accompagner des grillades ?

- Quelles sont les caractéristiques du vin qui affectent sur son accord avec un plat ?

Etape 2. Envisager une éventuelle réutilisation des ontologies existantes

Il existe des bibliothèques d’ontologies réutilisables sur le Web et dans la littérature. Par exemple, on peut  utiliser la bibliothèque des ontologies Ontolingua

(http://www.ksl.stanford.edu/software/ontolingua/ ) ou bien la bibliothèque des ontologies DAML (http://www.daml.org/ontologies/ ).

Etape 3. Enumérer les termes importants dans l’ontologie

Il est utile de noter sous forme de liste tous les termes à traiter ou à expliquer à un utilisateur. Par exemple, parmi les termes importants relatifs aux vins il existe : vin, cépage, établissement vinicole, localisation, couleur d’un vin, corps, odeur et contenance en sucre ; différents types de mets, tels que poisson et viande rouge, sous-types de vin tels que vin blanc, etc. Tout d’abord, il est important d’établir une liste exhaustive de termes et de ne pas se soucier de l’éventuelle chevauchement entre les concepts qu’ils représentent, les relations entre les termes ou tout autre propriété des concepts, ni si ces concepts sont des classes ou des facettes.

Etape 4. Définir les classes et la hiérarchie des classes

Il existe un certain nombre d’approches possibles pour développer une hiérarchie de classes. Un procédé de développement de haut en bas commence par une définition des concepts les plus généraux du domaine et se poursuit par la spécialisation des concepts. Par exemple, on peut commencer en créant des classes pour les concepts généraux Vin et Mets. Puis on spécialise la classe Vin en créant des sous-classes : Vin blanc, Vin rouge, Vin rosé. On peut en outre catégoriser la classe Vin rouge, par exemple, Bourgogne rouge, Cabernet Sauvignon, et ainsi de suite.

Un procédé de développement de bas en haut commence par la définition des classes les plus spécifiques, et se poursuit avec le regroupement de ces classes en concepts plus généraux. Par exemple, on peut commencer en définissant des classes pour les vins Pauillac et Margaux. On peut ensuite créer une super-classe commune – Medoc – qui à son tour est une sous-classe de Bordeaux.

Une procédé combiné de développement est une combinaison des deux approches, de haut en bas et de bas en haut. Au tout début, les concepts les plus saillants sont définis, ensuite ils sont généralisés ou spécialisés, suivant le cas. Nous pourrions commencer par quelques concepts du haut niveau tels que Vin et quelques concepts spécifiques, tels que Margaux. Puis, on peut les mettre en relation avec d’autres concepts de niveau intermédiaire, tels que Medoc. Ensuite, on peut poursuivre en créant toutes les classes de vins régionaux de France.

.

La figure ci-dessous montre une possibilité d’articulation entre les différents niveaux de généralité.

Aucune de ces trois méthodes n’est fondamentalement meilleure que les autres. L’approche combinée est souvent, la plus facile à utiliser pour la plupart des développeurs d’ontologies, étant donné que les concepts “ du milieu ” ont tendance à être les concepts les plus descriptifs du domaine.[8]

Si une classe A est super-classe d’une classe B, alors toute instance de B est également, une instance de A. En d’autres termes, la classe B représente un concept qui est “ une sorte ” de A. Par exemple, chaque vin Pinot Noir est obligatoirement un vin rouge. Par conséquent la classe Pinot Noir est une sous-classe de la classe Vin Rouge.

Étape 5. Définir les propriétés des classes – attributs

Les classes seules ne fourniront pas assez d’information pour répondre aux questions de compétence de l’Étape 1. Après avoir défini quelques classes, on doit décrire la structure interne des concepts. On a déjà sélectionné des classes à partir de la liste des termes que nous avons créée pendant l’Étape 3. La plupart des termes restants ont de fortes chances d’être des propriétés de ces classes. Ces termes comprennent, par exemple, la couleur d’un vin, son corps, son odeur et sa teneur en sucre ainsi que la localisation de l’établissement vinicole. Ces propriétés deviennent des attributs rattachés aux classes. Ainsi, la classe Vin aura les attributs suivants : couleur, corps, odeur, et sucre. Et la classe Etablissement vinicole aura l’attribut localisation. En général, certains types de propriétés d’objets peuvent devenir des attributs dans une ontologie : propriétés “ intrinsèques ” telle que l’odeur d’un vin ; propriétés “ extrinsèques ” telles que le nom d’un vin et son terroir; parties, si l’objet est structuré ; elles peuvent être des “ parties ” physiques ou abstraites (ex : les plats d’un repas).

Toutes les sous-classes d’une classe héritent les attributs de cette classe. Par exemple, tous les attributs de la classe Vin seront hérités par toutes les sous-classes de la classe Vin, y compris Vin Rouge et Vin Blanc. Nous ajouterons l’attribut supplémentaire niveau de tannin (bas, modéré, élevé) à la classe Vin Rouge. L’attribut niveau de tanin sera hérité par toutes les classes représentant des vins rouges (telles que Bordeaux et Beaujolais). Un attribut doit être rattaché à la classe la plus générale pouvant avoir cette propriété. Par exemple, corps et couleur d’un vin doivent être rattachés à la classe Vin, puisque c’est la classe la plus générale dont les instances auront un corps et une couleur.

Étape 6. Définir les facettes des attributs

Les attributs peuvent avoir plusieurs facettes décrivant la valeur du type, les valeurs autorisées, le nombre de valeurs (cardinalité), et d’autres caractéristiques de valeurs que les attributs peuvent avoir. Par exemple, l’attribut produit (comme dans “un établissement vinicole produit tels vins”) peut avoir de multiples valeurs et ces valeurs sont des instances de la classe Vin. C’est à dire, produit est un attribut ayant pour type de valeur Instance et pour classe autorisée Vin.

Étape 7. Créer les instances

La dernière étape consiste à créer les instances des classes dans la hiérarchie. Définir une instance individuelle d’une classe exige (1) choisir une classe, (2) créer une instance individuelle de cette classe, et (3) la renseigner avec les valeurs des attributs. Par exemple, on peut créer une instance individuelle Château-Morgon-Beaujolais pour représenter un type spécifique des vins Beaujolais. Château-Morgon-Beaujolais est une instance de la classe Beaujolais qui, à son tour, représente tous les vins Beaujolais. Cette instance a les valeurs d’attributs suivantes:

Corps : Léger

Couleur : Rouge

Odeur : Délicate

Niveau de tanin : Bas

Cépage : Gamay (instance de la classe Raisin (wine grape))

Producteur : Château-Morgon (instance de la classe Établissement vinicole)

Région : Beaujolais (instance de la classe Région viticole)

Sucre : Sec

Les classes et leurs noms

Il est important de distinguer entre une classe et son nom : Les classes représentent des concepts dans le domaine et non pas des mots désignant ces concepts. Le nom d’une classe peut varier suivant la terminologie choisie, mais le terme lui-même représente la réalité objective du monde. Par exemple, nous pouvons créer une classe Salicoques et le rebaptiser ensuite Crevettes – la classe représente toujours le même concept. Les associations appropriées de vin et de plats de salicoques devraient se référer aux plats de crevettes. Plus concrètement, la règle suivante devrait toujours être suivie : Les synonymes pour le même concept ne représentent pas de classes différentes. Les synonymes sont juste des noms différents pour un concept ou un terme. Donc, nous ne devrions pas avoir une classe appelée Crevette et une classe appelée Salicoque. Il y aura une seule classe, nommée soit Crevette soit Salicoque.

Héritages multiples

La plupart des systèmes de représentation des connaissances permettent l’héritage multiple dans la hiérarchie des classes : une classe peut être une sous-classe de plusieurs classes. Supposons que nous voulons créer une classe distincte pour les vins de dessert, la classe Vin doux. Le vin de Porto est à la fois un vin rouge et un vin doux. Par conséquent, nous définissons une classe Porto pour avoir deux super-classes : Vin rouge et Vin doux. Toutes les instances de la classe Porto seront aussi bien des instances de la classe Vin rouge que de la classe Vin doux. La classe Porto héritera les attributs et les facettes des attributs de ses deux parents. Ainsi, elle héritera la valeur DOUX pour l’attribut de la classe Vin doux et l’attribut Niveau de tanin et la valeur de son attribut couleur de la classe Vin rouge.

Une instance ou une classe

Décider si un concept particulier est une classe ou une instance individuelle dans une ontologie dépend des applications potentielles de l’ontologie. Trancher sur : où finissent les classes et où commencent les instances individuelles, commence par la définition du niveau le plus bas de granularité dans la représentation. Le niveau de granularité est à son tour défini par l’application potentielle de l’ontologie. Autrement dit, quelles sont les entités les plus spécifiques qui seront représentées dans la base de connaissances ? Par exemple, si nous devons parler seulement d’accord des vins avec des mets, nous ne serons pas intéressés par les bouteilles physiques particulières de vin. Donc, des termes tels que Merlot des Vignobles de Sterling seront probablement les termes les plus spécifiques que nous utiliserons. En d’autres termes, la classe Vin rassemble non pas des bouteilles individuelles de vins mais des vins particulières produits par des établissements vinicoles particuliers. Donc, le Merlot des Vignobles de Sterling serait une instance dans la base de connaissances. Par ailleurs, si nous souhaitons maintenir un inventaire des vins dans le restaurant, alors les bouteilles individuelles de chaque vin peuvent devenir des instances individuelles dans notre base de connaissances. De même, si nous souhaitons enregistrer les propriétés différentes de chaque millésime spécifique du Merlot des Vignobles de Sterling, alors tout millésime spécifique de ce vin sera une instance dans la base de connaissances et le Merlot des Vignobles de Sterling sera une classe contenant des instances pour toutes ses millésimes.

Qu’y a-t-il dans un nom ?

Définir des conventions à suivre lorsqu’on nomme les concepts dans une ontologie et y adhérer, non seulement rend l’ontologie plus compréhensible, mais aide également à éviter les quelques erreurs les plus fréquentes de modélisation. Plusieurs alternatives existent pour nommer les concepts. Souvent, il n’y a pas de raison particulière pour privilégier l’une ou l’autre de ces alternatives. Néanmoins nous avons besoin de définir une convention de nomination pour les classes et les attributs et y adhérer :

- Le système a-t-il le même espace de nomination pour les classes, attributs et instances ? C’est-à-dire, permet–il d’avoir une classe et un attribut ayant le même nom (tels qu’une classe établissement vinicole et un attribut établissement vinicole) ?

- Le système est-il sensible à la casse ? C’est-à-dire, traite-t-il de la même façon les noms selon qu’ils sont entrés en majuscules ou en minuscules (tels que Établissement vinicole et établissement vinicole)?

- Quels délimiteurs le système autorise-t-il pour les noms ? C’est-à-dire, les noms peuvent-ils contenir

des espaces, des virgules, des astérisques, etc. ?

Actuellement, les chercheurs mettent l’accent non seulement sur le développement des ontologies, mais aussi sur l’analyse des ontologies. Étant donné le nombre croissant d’ontologies qui vont être générées et réutilisées, l’offre des outils d’analyse augmentera proportionnellement. Par exemple, Chimaera (McGuinness et al.) fournit des outils de diagnostic pour analyser les ontologies.[9] L’analyse effectuée par Chimaera comprend aussi bien une vérification de la rigueur logique d’une ontologie que le diagnostic des erreurs habituelles dans sa conception.

Conclusion

Nous avons décrit ici une méthodologie de développement d’ontologie pour les systèmes déclaratifs de type FRL. Nous avons listé les étapes dans le processus de développement d’une ontologie et abordé les problèmes complexes de définition d’une hiérarchie de classes, des propriétés des classes et des instances. Toutefois, après avoir suivi toutes les règles et suggestions, la remarque la plus importante à retenir est : il n’y a pas qu’une seule ontologie correcte de référence pour un domaine précis. La conception des ontologies est un processus créatif et il ne peut pas y avoir d’ontologies identiques faites par des personnes différentes. Les applications potentielles d’une ontologie et la compréhension du concepteur, ainsi que le point de vue qu’il a du domaine traité, affecteront indubitablement les choix de conception de l’ontologie. Nous pouvons tester la qualité de notre ontologie uniquement en l’utilisant dans les applications pour lesquelles elle a été conçue.

Georges Vignaux

Références

Booch, G., Rumbaugh, J. and Jacobson, I. (1997). The Unified Modeling Language user guide: Addison-Wesley.

Brachman, R.J., McGuinness, D.L., Patel-Schneider, P.F., Resnick, L.A. and Borgida, A. (1991). Living with CLASSIC: When and how to use KL-ONE-like language. Principles of Semantic Networks. J. F., Sowa, editor, Morgan Kaufmann: 401-456.

Brickley, D. and Guha, R.V. (1999). Resource Description Framework (RDF) Schema Specification. Proposed Recommendation, World Wide Web Consortium: http://www.w3.org/TR/PR-rdf-schema.

Chimaera (2000). Chimaera Ontology Environment. www.ksl.stanford.edu/software/chimaera

Duineveld, A.J., Stoter, R., Weiden, M.R., Kenepa, B. and Benjamins, V.R. (2000). WonderTools? A comparative study of ontological engineering tools. International Journal of Human-Computer Studies

52(6): 1111-1133.

Farquhar, A. (1997). Ontolingua tutorial. http://ksl-web.stanford.edu/people/axf/tutorial.pdf

Gómez-Pérez, A. (1998). Knowledge sharing and reuse. Handbook of Applied Expert Systems. Liebowitz, editor, CRC Press.

Musen, M.A. (1992). Dimensions of knowledge sharing and reuse. Computers and Biomedical Research 25: 435-467.

Ontolingua (1997). Ontolingua System Reference Manual. http://www-kslsvc., stanford.edu:5915/doc/frame-editor/index.html

Rothenfluh, T.R., Gennari, J.H., Eriksson, H., Puerta, A.R., Tu, S.W. and Musen, M.A. (1996). Reusable ontologies, knowledge-acquisition tools, and performance systems: PROTÉGÉ-II solutions to Sisyphus-2. International Journal of Human-Computer Studies 44: 303-332.

Rumbaugh, J., Blaha, M., Premerlani, W., Eddy, F. and Lorensen, W. (1991). Object-oriented modeling and design. Englewood Cliffs, New Jersey: Prentice Hall.


[1] Gruber, T.R., A Translation Approach to Portable Ontology Specification. Knowledge Acquisition 5: 1993, 199-220.

[2] Price, C. and Spackman, K., SNOMED clinical terms. BJHC&IM-British Journal of Healthcare Computing & Information Management, 2000, 17(3): 27-31.

[3] Humphreys, B.L. and Lindberg, D.A.B., “The UMLS project: making the conceptual connection between users and the information they need”. Bulletin of the Medical Library Association, 1993, 81(2): 170.

[4] Natalya F. Noy et Deborah L. McGuinness, “Développement d’une ontologie”, Université de Stanford, Stanford, CA, 94305

[5] McGuinness, D.L., Fikes, R., Rice, J. and Wilder, S., An Environment for Merging and Testing Large Ontologies. Principles of Knowledge Representation and Reasoning: Proceedings of the Seventh International Conference (KR2000). A. G. Cohn, F. Giunchiglia and B. Selman, editors. San Francisco, CA, Morgan Kaufmann Publishers, 2000.

[6] Natalya F. Noy et Deborah L. McGuinness, “Développement d’une ontologie”, Université de Stanford, Ca.

[7] Gruninger, M. and Fox, M.S., “Methodology for the Design and Evaluation of Ontologies”. In: Proceedings of the Workshop on Basic Ontological Issues in Knowledge Sharing, IJCAI-95, Montreal.

Hendler, J. and McGuinness, D.L.,The DARPA Agent Markup Language. IEEE Intelligent Systems, 2000, 16(6): 67-73.

[8] Rosch, E., Principles of Categorization. Cognition and Categorization. R. E. and B. B. Lloyd, Hillside, NJ, Lawrence Erlbaum Publishers, 1978, 27-48.

[9] McGuinness, D.L., Abrahams, M.K., Resnick, L.A., Patel-Schneider, P.F., Thomason, R.H., Cavalli-Sforza, V. and Conati, C. Classic Knowledge Representation System Tutorial. http://www.belllabs.com/project/classic/papers/ClassTut/ClassTut.html

Pour que  l’analyse d’une idée soit vraiment efficace il faut disposer d’un minimum d’informations à analyser. Même si la chose semble paradoxale, le meilleur moyen d’arriver au bon résultat c’est de ne pas trop avoir d’informations. Ce qu’il faut pour prendre une décision, c’est d’avoir une faible densité informative. Ma proposition peut sembler à contre-courant alors que partout on nous dit qu’il faut disposer d’un maximum d’informations pour prendre une bonne décision. Aussi paradoxale que la chose puisse paraître, moins nous avons d’informations, plus simple et efficace est notre catégorisation du monde qui nous entoure.

Par exemple, si vous présentez une image floue à quelqu’un sur un écran d’ordinateur, et que vous la rendez de moins en moins floue, le cerveau émettra des hypothèses au fur et à mesure que l’image sera de moins en moins floue. Si vous le faites, disons en dix étapes séparées et peu espacées les unes des autres dans le temps, votre cerveau émettra plus de dix hypothèses quant à la nature de l’image avant de la résoudre. Si vous le faites en cinq étapes un peu plus espacées dans le temps, le cerveau n’émettra que cinq hypothèses pour identifier l’image. Le principe derrière ce phénomène est le biais de confirmation. Notre cerveau, dès qu’il émet une hypothèse, cherche par tous les moyens à confirmer son hypothèse. Donc, plus vous avez d’informations, moins vous êtes efficace et plus vous cherchez à valider de fausses hypothèses. En fait, plus nous avançons dans le temps, plus nous avons d’informations à propos du mode de fonctionnement des événements, moins nos prédictions par rapport à ces mêmes événements sont valides.

Faible densité informative

Lorsque vous êtes en présence de trop d’informations, vous êtes perplexe et vous vous demandez quoi faire. Dans plusieurs cas, certains s’en remettent à la puissance de traitement des ordinateurs pour colliger toutes les données et les mettre en relation afin de déceler le schéma informatif sous-jacent. Et pourtant, en réalité, la seule vraie façon de pouvoir soutirer de la pertinence d’un ensemble d’informations, c’est lorsque vous êtes en présence d’une faible densité informative. Ça vous semble contre-intuitif? Voici mon point de vue sur la chose. John D. Barrow, dans son livre « La grande théorie[1] », aborde le problème de la façon suivante :

« […] inextricablement liée à la compressibilité algorithmique du monde est la capacité de l’esprit d’effectuer des compressions. Nos esprits ont pris comme supports les éléments du monde physique et ont été aiguisés, tout au moins partiellement, par le processus de sélection naturelle, pour devenir aujourd’hui coupants. Leur aptitude à censurer l’environnement et leur capacité de survie sont reliées de manière évidente à leur qualité de compression algorithmique. Plus le stockage et la codification de l’expérience naturelle de l’organisme sont efficaces et plus l’organisme peut écarter les dangers. Dans la phase la plus récente de l’histoire de l’homo sapiens, cette capacité a atteint de nouveaux sommets de sophistication. […] Plus précisément, nos esprits génèrent des simulations d’expériences passées dans le contexte de situations nouvelles, ce qui requiert un cerveau passablement exercé. Il est clair que les capacités mentales doivent passer un certain seuil pour effectuer une compression algorithmique digne de ce nom. On peut comprendre que ce ne soit pas le cas : s’ils étaient si fins qu’ils puissent consigner la plus petite information possible au sujet de tout ce que nous voyons et entendons, alors nos esprits seraient surchargés d’informations. […] Le fait que nos esprits abandonnent toute ambition de collection et de traitement total de l’information a pour conséquence que le cerveau effectue une compression algorithmique de l’Univers, qu’il soit ou non effectivement compressible. En pratique, le cerveau opère par troncature. »

Lorsque j’ai fait mes études doctorales en sciences cognitives au début des années 2000, cette idée simple et élégante de Barrow m’avait séduite, à savoir que le cerveau opère par troncature et compression algorithmique. Au fil des années, je me suis rendu compte d’une chose : le cerveau n’effectue pas de compression algorithmique. Il comble plutôt les trous d’informations. Je m’explique. S’il fallait que le cerveau procède par compression algorithmique, cela impliquerait forcément que lorsqu’il restitue l’information, celle-ci serait accessible dans son intégralité. Ce qui veut donc dire que le cerveau serait dans un constant processus de décompression pour ramener à notre conscience les événements passés et les informations dont nous avons besoin pour agir et réagir aux situations. Mais, la nature a une particularité bien précise : s’il y a un million de façons de faire une chose, elle choisira toujours l’option la plus simple.

Par exemple, nous savons tous que lorsque nous nous remémorons un fait ou un événement, celui-ci ne nous est jamais présenté dans son intégralité. Il faut donc supposer que le cerveau s’appuie plutôt sur une faible densité informative, et qu’il comble les trous pour nous fournir un portrait d’ensemble. Lors d’un procès, les avocats savent fort bien que la mémoire est une faculté qui oublie, et ils se servent de cette faille pour tenter de discréditer l’une ou l’autre partie. Donc, si le cerveau compresse l’information, c’est qu’il doit être capable de la décompresser. Et s’il est capable de la décompresser, il devrait au moins nous retourner une image assez fidèle de la totalité de cette même information. À l’évidence, ce n’est pas le cas, car nous avons toujours des trous béants.

Acquisition comprimée

Je n’aime pas l’exemple que je vais vous présenter, car il a tendance à faire un lien direct entre le fonctionnement d’un système informatique et le fonctionnement du cerveau. Par contre, il a au moins l’avantage de clarifier mon propos. Lorsque vous décompressez un fichier informatique, vous retrouvez l’intégralité de l’information de celui-ci. Il n’y a pas de trous dans l’information retournée. Elle est tout simplement restituée dans son intégralité. Même si le cerveau avait cette capacité de compresser l’information, même s’il est massivement parallèlement connecté du point de vue neuronal, il lui serait strictement impossible de conserver toutes les informations compressées. Il faut donc supposer que le cerveau utilise une tout autre méthode, soit celle de l’acquisition comprimée. L’analogie que je pourrais utiliser pour expliquer l’acquisition comprimée est la suivante : il suffit de relier l’ensemble des points pour obtenir une image globale, un peu comme dans les dessins où il faut relier les points selon une séquence déterminée.

Le cerveau fonctionne par acquisition comprimée. C’est-à-dire qu’il ne retient que l’essentiel et qu’il rejette dès le départ tout ce qui est superflu. Donc il ne compresse pas. C’est par la suite qu’il reconstruit une « image » globale en comblant les informations manquantes.

Si le cerveau ne compresse pas, alors comment fait-il pour relier les points entre eux et ajouter l’information manquante entre ceux-ci ? Encore ici, je vais procéder par analogie. Avez-vous entendu parler de la ℓ1 minimization ? Il s’agit d’un procédé algorithmique qui permet de reconstruire des images ou d’autres types d’informations à partir de données manquantes.

Un jour de février 2004, Emmanuel Candès, alors chercheur au CalTech, se demandait comment clarifier une image en provenance d’un système d’imagerie par résonance magnétique. Le problème, c’est que, parfois, le système n’a pas assez de temps pour compléter le processus de scanning. L’idée lui vint d’appliquer le filtre de la ℓ1 minimization, et surprise, il obtint au bout de l’opération une image tout à fait claire et détaillée. Surpris, il considéra la chose comme impossible et reprit l’opération sur d’autres images et le résultat fut le même. Il était donc possible de reconstituer une image à partir d’un minimum d’informations. Ce fut le début de l’ouverture d’un tout nouveau champ de recherche : le compressed sensing. Rapidement, des fonds de recherche furent alloués à plusieurs scientifiques pour développer les mathématiques les plus appropriées pour traiter différents types d’informations. Imaginez un peu la chose : des systèmes de résonance magnétique qui peuvent fournir une image au bout de quelques minutes plutôt que de quelques heures, sans compter tout le champ de traitement des données, de l’écoute électronique, des applications militaires, des applications économiques, de la génomique, etc. C’est donc un tout nouveau champ d’applications qui se développe.

Dans le domaine de l’informatique et des communications, il faut s’attendre à une révolution du traitement des données. Au lieu d’avoir des algorithmes de compression qui seront devenus obsolètes dans vingt ou cinquante ans, une simple procédure mathématique universelle permettra de reconstruire les images, les vidéos, les données, etc. Dans le domaine de l’imagerie médicale et astronomique, les retombées seront absolument sidérantes. Par exemple, si vous avez une sonde spatiale qui orbite autour de Saturne, vous n’avez pas le luxe d’avoir une mémoire embarquée importante et plusieurs processeurs pour compresser l’information. Il vous suffit donc de procéder par acquisition comprimée d’images et vous laissez le soin aux ordinateurs sur Terre de faire tout le travail de reconstitution. Voici comment fonctionne le processus :

  1. Une caméra capture seulement qu’une partie de l’information disponible de façon aléatoire.
  2. L’algorithme ℓ1 minimization est appliqué. Celui-ci commence tout d’abord par choisir arbitrairement l’une des multiples façons de combler l’information manquante.
  3. L’algorithme tente de définir la nature de la faible densité informative de l’image. Pour ce faire, il tente de modifier l’image par des couches colorées successives.
  4. L’algorithme insère de simples rectangles qui se marient à la couleur du pixel adjacent. S’il détecte quatre pixels verts adjacents, il ajoute un pixel vert.
  5. Itération après itération, l’algorithme ajoute les plus simples formes possible tout en poursuivant sa recherche de faible densité informative. Éventuellement, il arrive à produire une image qui est presque la reconstitution parfaite de l’image originale.

Maintenant, imaginez cette technique appliquée aux enquêtes policières. À partir de bandes vidéo pas toujours très claires et souvent floues, il devient désormais possible de clarifier le tout et d’avoir une image nette et précise. Dans le domaine de la sécurité, il est certain que cette technique a un bel avenir, surtout que nous exigeons de plus en plus de mesures de contrôle pour nous protéger de l’imprévisible. Mais au-delà des prouesses techniques, la notion d’acquisition comprimée a un avantage encore plus intéressant pour nous. Elle nous permet d’envisager comment pourrait fonctionner le cerveau dans la classification du monde qu’il nous propose. Imaginez maintenant toutes les possibilités qui s’offrent à nous en terme de classification et d’organisation du Web.


[1] Barrow John D., La grande théorie, coll. Champs, Flammarion, Paris, 1996, p. 250.

Il y a certaines idées fausses qu’il est nécessaire de corriger. (1) L’une est celle de la métamorphose telle celle de la chrysalide en papillon ou du têtard en grenouille. C’est la métamorphose au sens que lui donne le poète latin Ovide. L’autre idée fausse répandue est celle de « l’échelle des êtres » ou « Scala Naturae ». Selon cette idée, les organismes peuvent être classés par ordre de complexité croissante. Cette idée était déjà chez Aristote. Elle sera reprise par Leibniz (1646-1718). Selon ce principe de complexité, en bas on trouverait  les quatre éléments – l’eau, la terre, le feu, l’air -, au-dessus il y aurait les pierres et les minéraux, au-dessus encore les plantes, et enfin, les animaux, avec au sommet de l’échelle : l’homme. Cette classification linéaire continue d’imprégner nombre d’esprits…

Il est vrai que les idées neuves ont bien du mal à s’imposer. Dans les sciences modernes du vivant, une première idée neuve va bousculer ces idées naïves précédentes : c’est celle de « plan d’organisation ». Elle permet une première approche du concept d’« homologie » qui sera central dans la théorie de l’évolution. L’idée est que si deux animaux possèdent le même plan d’organisation, alors on peut comparer les organes, les caractères de ces animaux. Cette idée, on la doit à Etienne Geoffroy Saint-Hilaire. Il la nomme « principe des connexions ». Cela signifie que des organes qui se situent de la même façon dans un plan d’organisation interne des animaux sont comparables ou « homologues » : on les définit par leurs « connexions » entre eux et avec les autres organes et non plus, comme autrefois, par leur fonction ou leur forme. Exemple : les membres antérieurs des vertébrés (oiseaux ou homme) ont tous un humérus. Chez tous ces vertébrés, on appellera humérus cet os parce qu’il est, à chaque fois, situé entre la ceinture scapulaire et un couple d’os longs parallèles – radius et cubitus – eux aussi définis selon le même principe géométrique.

Une deuxième idée neuve est celle, géniale, de Georges Cuvier, fondateur de la paléontologie des vertébrés au début du XIXe siècle. Cuvier établit, le premier, qu’à des époques très anciennes, existaient des animaux qui ont aujourd’hui disparu. Notamment à cause des changements climatiques sur de longues périodes. Par exemple, on trouvait, il y a très longtemps, des crocodiles sur les berges de la Seine. Le fait alors que certains de ces animaux n’existent plus, met en évidence « la mort des espèces » : des espèces peuvent disparaître à jamais.

Au début du XIXe sècle, on dispose donc, grâce au concept d’homologie, d’une méthode efficace de comparaison des organes et des caractères. On sait que les métamorphoses, au sens antique du terme, n’existent pas. L’idée de « génération spontanée » est réfutée et on sait surtout que la terre a été formée il y a très longtemps et que les espèces peuvent disparaître. Si on réfléchit alors à la formation des espèces, deux hypothèses sont en concurrence.

L’hypothèse créationniste avance qu’à un moment donné, un certain nombre d’espèces ont été créées. Mais si les espèces meurent avec le temps, on peut imaginer que leur nombre va tendre vers zéro. Comment se sortir de cette contradiction ? Cuvier propose l’hypothèse de créations multiples : les temps géologiques ont été ponctués par des séries de catastrophes qui ont fait disparaître des espèces et en même temps contribué à créer de nouvelles espèces – ce qui a compensé les disparitions. Le fixisme est donc vérifié : le nombre d’espèces créées est stable.

L’hypothèse transformiste considère au contraire, que les espèces se transforment les unes les autres au cours des temps. Lamarck est le premier à avancer cette hypothèse. Il l’expose dans le « Discours d’ouverture du cours de l’an X » qu’il prononce en 1802 au Muséum d’histoire naturelle. Il redéveloppe l’idée dans son ouvrage : « Philosophie zoologique » paru en 1809. Il fait l’hypothèse de plusieurs types de transformations, qui depuis ont été remis en cause, notamment lors de l’apparition de la théorie darwinienne.

(1) On lira avec profit le petit ouvrage d’Hervé Le Guyader : « Classification et évolution », Paris, Le Pommier, 2003.

Le Web sémantique désigne un ensemble de technologies visant à rendre les ressources du Web accessibles et utilisables par les programmes, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C. C’est un cadre commun qui permet le partage de données au-delà des frontières entre applications et communautés. C’est un effort collaboratif mené par un grand nombre de chercheurs et de partenaires socio-économiques. Il se fonde sur le cadre fourni par le « Resource Description Framework (RDF) ». Le Web sémantique, en tant que projet et programme, répond à deux types de préoccupations. Il s’agit d’abord de construire des formats communs, propres à l’intégration de données de diverses sources et à l’échange des documents. Il s’agit aussi d’élaborer un langage rendant compte de la relation entre ces données et les objets du monde réel, et permettant donc de « circuler » dans des ensembles de bases de données.

C’est dans ce contexte que Tim Berners Lee proposa dès 1994, la notion de « métadonnées » utilisables par les machines, lors de la conférence WWW 94 où fut annoncée la création du W3C. Ces métadonnées formelles depuis, sont présentées comme une représentation utilisable par les machines de l’information contenue dans les documents, par exemple le fait qu’une personne X est employée par une organisation Y.

Le développement de cette idée aboutit à la publication en 1999 de la première version de RDF (Resource Description Framework), langage qui définit un cadre général pour la standardisation des métadonnées des ressources Web.

Sur la base de RDF se sont ensuite développés des vocabulaires spécifiques destinés à des applications particulières, comme FOAF conçu pour décrire les relations entre personnes, puis des langages destinés à structurer ces vocabulaires, comme RDFS et le langage d’ontologie OWL, publiés dans leur forme finale en février 2004.

Au cours de cette évolution, la notion de ressource a quitté son sens original de « document publié sur le Web » pour s’étendre à des sens plus généraux et plus abstraits. Dans les langages d’ontologie, les ressources décrites sont des concepts comme des classes, des propriétés, ou des concepts utilisés pour l’indexation. À ce titre, les langages et technologies du Web sémantique sont parfois présentés comme des outils de représentation des connaissances adaptés à l’environnement Web, et permettant de transformer automatiquement les données en information, et les informations en savoirs.

Le Web sémantique s’appuie donc sur la fonction primaire du Web « classique » : un moyen de publier et consulter des documents. Mais les documents traités par le Web sémantique contiennent non pas des textes en langage naturel (français, espagnol, chinois, etc.), mais des informations formalisées pour être traitées automatiquement. Ces documents sont générés, traités, échangés par des logiciels. Ces logiciels permettent souvent, sans connaissance informatique, de :

* générer des données sémantiques à partir de la saisie d’information par les utilisateurs ;
* agréger des données sémantiques afin d’être publiées ou traitées ;
* échanger automatiquement des données en fonction de leurs relations sémantiques ;
* générer des données sémantiques automatiquement, à partir de règles d’inférences.

Cela implique en premier lieu de s’interroger sur les principes de classification à l’œuvre aussi bien dans les savoirs humains que dans le Web. Des millions de documents sont en effet, « installés » sur le Web. Mais l’accessibilité à ces documents n’est que partielle. Un moteur de recherche usuel permet un accès non sémantique.

Un accès « sémantique » sera réalisé lorsque les mots entrés par l’internaute dans son moteur de recherche seront décodés en termes de sens puis reliés à des documents eux mêmes indexés selon leur sens, grâce à des marqueurs spéciaux dans les pages Web (« balises » permettant de relier les pages). C’est ce que l’on nomme le « Web sémantique » comme on vient de le voir. Pour ce faire, comme cela a été dit précédemment, il faut développer un langage de traitement/classification sémantique par exemple à base d’ontologie.

Une classification ou système de classification est un système organisé et hiérarchisé de classification d’«objets ». Les classifications sont utilisées dans tous les domaines d’activités humaines (les espèces vivantes, les maladies, les produits ou services, les documents dans une bibliothèque…). Les classifications portant sur un domaine limité sont généralement bien admises par les spécialistes du domaine. Les classifications à vocation universelle, en revanche, sont toujours tributaires d’un point de vue et sont donc l’objet de nombreuses critiques. Elles apportent cependant un éclairage utile aux réflexions sur la nature de la connaissance et les processus cognitifs mis en jeu.

Les classifications sont donc importantes pour organiser les connaissances. Classer les objets ou les connaissances, c’est dire comment ils/elles se situent les un(e)s par rapport aux autres.

Maintenant que l’ouvrage « Tendances » est paru, il nous a paru pertinent à Pierre Fraser et moi-même, de tenter une aventure commune sur la notion de « Web sémantique ». Elle prendra l’allure de fragments écrits, échangés entre nous deux, avec des fils conducteurs !
L’idéal est une sorte de blog que l’on ouvrira à d’autres ! Le fil conducteur général pourrait suivre, dans l’immédiat, les étapes d’interrogation suivantes :

- Le web sémantique ? Classer, penser. Penser, classer.
- La tradition du classement ? Idées éternelles, idées opportunes ? Depuis le conflit Platon-Aristote…
- Le statut des objets : quelles entités ? comment classer ? La « forêt des taxinomies »…
- Les relations : le langage et la réalité ?
- Le lecteur comme constructeur de parcours. Chemins de la connaissance ?
- Le Web, lieu de navigation ? Comment s’y perdre ? Comment s’y retrouver ? Quels processus ?
- Le Web univers ? Paradis ou enfer ? Un océan de données : s’y noyer ? Quelles balises ? Quels repères ?
- Des routes à tracer : l’avenir n’est pas à savoir classer, mais à savoir relier: de nouvelles compétences ?

Les tentatives de classification naturelle prennent source dès l’Antiquité. On en trouve trace chez Aristote (384-322 av. J.-C.) et chez Théophraste (v.  372-v. 287 av.J.-C.), son successeur à la direction du Lycée, sous la forme d’une classification des végétaux. Jusqu’au XVIIIe siècle, ce sera en effet la botanique qui fera l’objet de toutes les classifications. La raison est simple : les animaux proches de l’homme ou en interaction avec lui sont peu nombreux et facilement mémorisables ; en revanche, le nombre de plantes utilisées en pharmacopée, en agriculture ou dans l’art des jardins est considérable. Très tôt donc, des professionnels de la botanique et des herbes médicinales vont vouloir consigner leurs connaissances. Les premières classifications sont donc utilitaires. Elles seront perfectionnées au moyen âge.

Une étape importante est celle de la Renaissance, époque à laquelle les philosophes vont se poser la question de savoir si ces classifications relèvent de la théorie ou sont effectivement le reflet d’un « ordre de la Nature ». La réponse viendra vite : non, les classifications utilitaires ne sont pas très structurées. D’où la conséquence : aux XVIIe et XVIIIe siècles, les réflexions, nombreuses, vont porter sur la méthode logique à emprunter. De multiples « systèmes » seront proposés. Surtout, vers le milieu du XVIIIe siècle, époque de Linné, les scientifiques constatent que de grandes familles de la botanique émergent des observations : les graminées, les rosacées, les orchidacées, etc. De cette constatation, Linné et ses contemporains vont conclure qu’en utilisant différents caractères, on retrouve à chaque fois ces grandes familles de la botanique. Si alors, on retrouve ainsi régulièrement cette classification, serait-ce qu’il existe un ordre sous-jacent : la « classification naturelle », traduisant l’ordre de la nature ? Linné est l’adepte le plus connu de ce courant. C’est en 1758 qu’il publie la dixième édition  de son « Systema Naturae », véritable encyclopédie des recherches en systématique animale et végétale en Europe. Cette édition, surtout, introduit le principe de la dénomination binomiale, qui consiste à donner un double nom – nom de genre suivi du nom d’espèce – à tout organisme vivant. C’est l’origine de la systématique moderne.

L’interrogation précédente se transforme alors : s’il existe une classification naturelle, y a-t-il une « méthode naturelle » pour y accéder ? D’avance, on peut dire qu’il s’agira là d’une quête inépuisable et sans issue… Le progrès essentiel, on le doit à Bernard de Jussieu (1699-1777), botaniste de Louis XV. Son neveu, Antoine Laurent de Jussieu (1748-1836), sera titulaire d’une des premières chaires de botanique au Muséum d’histoire naturelle de Paris.

L’histoire est la suivante : Louis XV charge Bernard de Jussieu de composer au Trianon de Versailles, un jardin botanique qui soit le reflet de la classification naturelle. Jussieu a une première idée géniale : il fabrique une carte du jardin qu’on appellera le « Système du Trianon » et que publiera en 1789 Antoine Laurent de Jussieu dans son « Genera plantarum ». Sur cette carte, chaque espèce est figurée par une petite surface. La surface est plus grande quand elle rassemble des espèces qui se ressemblent : c’est un petit « bosquet » qui représente un « genre ». Les différents genres sont regroupés dans une parcelle de plus grande taille, appelée « famille ». La question alors est celle de savoir quels sont les critères selon lesquels on va rapprocher espèces et genres. C’est là que Jussieu va avoir une seconde idée géniale : il va rechercher les caractères précis qui restent constants à l’intérieur de chacune des parcelles, c’est-à-dire pour chaque groupe d’organismes – ou « taxon » – rassemblés en espèce, genre ou famille. Jussieu comprend que, pour définir les familles, le caractère clé est le « plan d’organisation » de la fleur. Il existe ainsi une fleur de type « orchidacée », une fleur de type « rosacée », etc. On peut alors décrire avec précision un certain ordre de la nature. On pense même avoir trouvé la méthode naturelle pour parvenir à la classification naturelle.

Bientôt, les zoologistes adoptent l’idée. Ainsi, le botaniste puis zoologiste Jean-Baptiste Lamarck (1744-1829) va appliquer les techniques des Jussieu aux animaux qu’il caractérise comme « sans vertèbres ». Geoffroy Saint-Hilaire (1772-1844) va faire de même avec les vertébrés et Georges Cuvier va tenter de rassembler l’ensemble du règne animal à partir des idées de Lamarck. Il applique à la zoologie le concept de « plan d’organisation » qui avait servi à la botanique. Chacun des quatre embranchements qu’il conçoit alors est spécifié par un plan d’organisation particulier. Ainsi, pour les radiaires (méduses, oursins), les articulés (crustacés, insectes), les mollusques (gastéropodes, lamellibranches) et les vertebrés (« Vertebrata »).

Aujourd’hui, nous sommes passés de quatre à trente-sept embranchements. On a découvert aussi d’autres organismes avec de nouveaux plans d’organisation. Le concept de plan d’organisation est donc opérationnel et on dispose d’une méthode pour appliquer une classification. La nécessité est de s’accorder sur le sens à donner à cette classification.

Les formes organisent les systèmes et les systèmes se distinguent par les formes qu’ils empruntent. Ces formes, ce sont des différences qui très vite, permettent le découpage des fonctions et des significations. On peut mieux expliquer ainsi aux adolescentes par exemple (1) , les transformations physiologiques qu’elles subissent ou vont subir, les maladies qu’il faut éviter, les mutations du désir sexuel en elles si on les différencie selon trois tranches d’âge au prix de formules qui n’engagent à rien :
(i) 12 ans : « Début de la puberté (du latin : se couvrir de poils et bienvenue dans l’âge ingrat ! […] Des sentiments amoureux peuvent parfois se développer pour une amie… » ; (ii) 15 ans : « Même si les règles sont déjà apparues, la capacité de féconder arrive un peu plus tard (15-16 ans) […] Sexualité : C’est l’obsession ! Savoir comment ça se passe, l’avoir fait, ne plus paraître novice en la matière… » ; (iii) 20-25 ans : « La taille est définitivement atteinte. […] Sexualité : A 25 ans, le désir d’enfant fait son apparition… » (TopModel, mai 1997, n° 15)

Ainsi va la vie, peut-on penser, du moins en termes de signes qui serviront de repères pour classer et dont les jeux de contraste aideront à surprendre pour bousculer les images trop classiques ou les catégories reçues :
« Ayant l’été 1996, réussi son bac nutrition (eh oui, il n’y a pas que des bacs philo, sciences ou éco), elle a décidé de se rendre à Paris pour les vacances. Là c’est la rencontre avec Metropolitan et, depuis, c’est la tornade. Diana a défilé en octobre dernier et ne cesse d’être demandée. En conçoit-elle une fierté quelconque ? Pas le moins du monde. […] La seule personne au monde qui la laisse bouche bée d’admiration, c’est sa maman, mère au foyer. Les vedettes des petit et grand écrans la laissent de marbre. […] C’est une petite fille, malgré ses vingt ans, sa stupéfiante maturité et, déjà, son professionnalisme. Surtout, qu’elle rest comme elle est, pure, sincère, douce et spontanée, perle entre les perles… » (20 ans, mai 1997, n° 128)

On aura deviné qu’il s’agit d’un mannequin de mode tel qu’il en surgit chaque année dans les magazines à faire rêver et que le jeu de contraste consiste ici à opposer à cette notion selon laquelle la mode ou la photographie serait des milieux où la célébrité (dont rêvent les lectrices) vous fait perdre la tête, une autre notion qui serait celle de l’exceptionnalité de la princesse de Galles, Lady Diana, au sens qu’elle sait rester simple (comme les lectrices), pure, petite fille malgé ses vingt ans, etc.
On voit comment une notion admise définissant une catégorie de comportements associés à un certain milieu (les mannequins) peut être bousculée par un contre-exemple doté d’autres propriétés (la pureté, la simplicité), renvoyant à d’autres catégories (les valeurs familiales) et donc contredisant cette notion classique qu’on se faisait du milieu de la mode comme trouble, « impur ».
De même peut-il en advenir de l’idée qu’on a de la beauté féminine : un visage lisse ou parfois, jeune, sans ride, etc. Eh bien non, voici ce qu’on pouvait lire à l’occasion :
« Il n’y a rien de plus beau qu’une femme qui a des cernes. Les cernes, c’est ce qu’il y a de plus sexy au monde » Pourquoi pas ? « Un visage lisse dégage moins d’émotion qu’un visage fatigué. » (20 ans, mai 1997, n° 128)

Ce qu’on appelle idées dans la société donne parfois, on le voit, l’impression d’un « grand marché des formules ». On ne sait plus trop ce que sont les « objets de réalité » ni comment s’organise la pensée et les mots tâtonnent pour tenter de penser. On va chercher dans les télévisions, ces témoignages qui s’enchaînent les uns aux autres comme de petites fables de vie, d’existences qui essaient de se montrer. « Le top model, nous dit le psychanaliste Tony Anatrella (1993), a pris le relais du maître à penser. Quand on ne sait plus penser, on présente son corps. Réfléchir « prend la tête » et donne la migraine à une société qui ne sait plus discerner la signification de ce qu’elle vit et promeut. » Il ajoute : « Les convictions sont floues et les désirs provisoires. D’où le succès des mages, des astrologues, des sectes, des extraterrestres, des possessions, des vies multiples, ect. » (Le Monde, 2-3/04/1995)
Si les explications du monde se font plus troubles parce que plus lointaines, plus confuses parce que plus abstraites, c’est au plus simple qu’alors, on va faire recours, au magique, au « mythique » comme à une sorte de mémoire du monde enfouie, archaïque :
« Sans vouloir confondre science et mythologie, ni même les rapprocher, j’ai tenté de dire qu’un écart de plus en plus considérable s’est creusé entre les connaissances en expansion de la physique ou de la biologie et les pouvoirs étriqués de l’imagination. Du coup, pour essayer de nous expliquer ce qu’ils font, les savants doivent recourir à des apologues, à des récits, qui restaurent à l’usage du profane, de vieux modes de pensée.
« Cette réutilisation inattendue de la pensée mythique est destinée à servir de médiation entre les découvertes des scientifiques et l’homme de la rue, incapable de comprendre de telles découvertes de l’intérieur, et réduit par là-même à les apercevoir seulement sous la forme d’un monde imaginaire, paradoxal, étrange et déroutant, qui présente à ses yeux les mêmes propriétés que celui des mythes. » (C. Lévi-Strauss, « Entretien », Le Monde, 8/10/1991)

Mythes ou magies, peu importe, car ces explications que nous nous fabriquons des origines du monde et des phénomènes, ne sont que les (pauvres) moyens que le sens commun  ne cesse d’emprunter pour savoir quelle réalité il y a dans les ‘choses’ et quels mots conviennent aux ‘choses’, car : « Nous ne trouvons jamais de mots capables d’exprimer quelque chose de définitif » (2) . Au moins tentons-nous sans cesse de classer les choses pour les nommer et de les nommer pour les catégoriser. C’est une vieille histoire du monde, harcelante, la nôtre…

Notes :

1. Je m’étais ainsi livré autrefois, à quelques parcours surprenants dans des magazines pour adolescentes.

2.Gadamer, Hans, Vérité et méthode, Paris, Seuil, 1960.

Dès que je pense le monde, je l’organise et je ne peux pas penser le monde sans classer les choses ou les phénomènes, qui à mon sens, le composent. Tel est le paradoxe de nos vies et de nos sociétés : tout se classe pour se penser, tout s’organise pour se comparer et donc se catégoriser. Très tôt, nous savons qu’il y a des plantes et des animaux et que cela organise la Nature et qu’on doit la penser ainsi : elle est constituée par les plantes, les animaux et par nous, humains. Nous humains : divisés en riches et pauvres, en beaux, en laids, en méchants, en gentils, en jeunes, en vieux, en sains, en malades, etc.

Une formule m’avait frappé, lue sur la couverture d’une revue : « Le bel avenir de la pauvreté » (Esprit, mai 1997). La formule choquait. Pourquoi ? D’abord, parce qu’à cette époque, on ne parlait guère encore de crise, et que ensuite,  pauvreté et avenir ne vont pas bien ensemble : on ne choisit pas d’être pauvre : on l’est, on le devient, mais ce n’est pas un avenir au sens de réussite qu’on attache d’habitude à ce mot. On dit « il a un bel avenir », mais on ne dit pas « la pauvreté est un bel avenir ». En revanche, si on pense que la pauvreté est un phénomène qui se répand dans la société, alors oui, on pourra dire qu’elle a « un bel avenir », et la formule provocante peut être douloureuse ou laisser indifférent. Dans les deux cas, elle signifie la même chose : la coupure sociale – on  parle de « fracture » – s’accentue : il y a de plus en plus de pauvres, mais on ne sait pas s’il y a de moins en moins de riches ou si les riches deviennent de plus en plus riches.

Ce qu’on sait, c’est qu’il faut s’habituer à penser la société comme catégorisée en riches et pauvres, mais aussi, selon les nouveaux mots en usage, en exclus, en intégrés, en performants, en inadaptés sociaux, en illettrés, en drogués, en suicidaires, en isolés dans les villes, en oubliés à la campagne, en vaincus ou en gagnants, en dynamiques, en fonctionnaires, en contractuels, etc. Voilà le phénomène : nous ne pouvons plus considérer la société sans immédiatement nous mettre à catégoriser ceux qui la constituent, par revenus bas ou élevés, par domicile fixe ou sans domicile fixe, par travail et salaire ou sans travail et sans salaire, etc.

La société ne s’imagine plus comme un ensemble ou un tout : pour la penser, il nous faut la classer, la subdiviser, la hiérarchiser, la décomposer comme si nous courrions sans cesse après les étiquettes pour tenter de comprendre et de s’y retrouver. Aux « nouveaux pauvres » – on les appelait ainsi dans les années 1982-1983 – ont succédé les « exclus », ce qui déjà signifie qu’on s’habitue au phénomène. Le « développement social des quartiers sensibles » – ce qui était une belle formule – a été remplacé par la « politique de la ville » – ce qui est plus économique et signifie tout et rien. Quant à l’administration, elle a inventé le terme ‘SDF’ ou « ’sans domicile fixe » pour tous ceux qui n’ont plus ni résidence ni travail ni droit de vote, etc. Tout se passe comme si la société acceptait de plus en plus ces distinctions qui se voient, se touchent, s’oublient, s’indiffèrent. Une société de multiples dualités où tout devient relatif et donc admis : la pauvreté n’a pas le même sens aux Indes, dans un bidonville de Rio de Janeiro, dans une ville nord-américaine, ou en France selon qu’on habite le nord ou le sud

Avoir un salaire, un emploi stable, autrefois définissait l’individu et les salariés définissaient la société. La rareté de l’emploi est maintenant au cœur de la société et la recherche du travail devenue obsession majeure. Cette précarité est de plus en plus admise de même que les inégalités parfois considérables entre revenus. L’augmentation des écarts entre salaires et modes de vie compte moins que cette nécessaire “flexibilité” du travail que recommandent les économistes. Après tout, les Etats-Unis s’accommodent bien d’un taux de chômage important touchant les Américains à bas niveau d’instruction et la part de la population frisant l’illettrisme y est deux fois supérieure à celle de l’Europe. Mais plus que s’en accommoder, on y considère que l’absence d’emploi touchant en majorité les habitants des ghettos n’est pas une exclusion que ceux-ci subissent de la part de la société, mais une incapacité à travailler que ces habitants des ghettos entretiennent eux-mêmes et dont ils sont responsables. Comme par une sorte de “nature” qui serait la leur, qui les rendrait différents des autres, inaptes à s’intégrer. Ainsi se constituent des “réserves” confinées dans des territoires tel qu’on le  constate déjà en France à propos de certaines “zones” de banlieue où les violences sont ordinaires et les violents, de plus en plus jeunes, ayant très tôt accumulé tous les handicaps sociaux, mais maîtrisant avec brio les mécanismes de la justice, et « commettant des infractions en sachant exactement combien elles sont tarifées » (Le Monde, S.Bd et B.G., 24/05/1997).

Sourdement, insidieusement, parfois avec éclat, nous sommes ainsi entrés dans “une guerre des mondes”, non pas seulement de pays pauvre à pays riche, mais à l’intérieur même des pays et dans les villes, de quartier à quartier, de rue à rue ou d’étage à étage dans un même immeuble. Certains y voient la manifestation d’une conflit entre les cultures voire d’un affrontement entre “la barbarie” et “la culture”, situation propice à la multiplication des mafias et des bandes antagonistes (Huntington, 1996), mais aussi au renforcement des frontières entre territoires, s’opposant les uns aux autres . Ainsi : « En France, la tendance actuelle est indéniablement à des formes de regroupement où les « pairs » se retrouvent entre eux, ce qui correspond à un phénomène que Daniel Cohen nomme « l’appariement sélectif » et qui donne lieu à des sanctuarisations urbaines » (Mongin, 1997, Paugam, 1996). Le ‘chez moi’ signifie davantage que ‘le chez-soi’ : c’est ce qui n’est pas ‘chez toi’ et c’est ce qui nous met à distance infranchissable, moi de toi, toi de moi, les uns des autres. On s’agglomère en zones à l’intérieur desquelles les individus se catégorisent entre eux comme égaux et ces zones les mettent à distance de ceux qui sont susceptibles de les gêner, à commencer par les mendiants que certaines villes chassent déjà de leurs espaces publics.

La ségrégation permet la hiérarchie entre les gens de même qu’entre les espèces ; mieux : elle la légitime. Au travers d’évidents ou subtils critères. Il y a d’abord ce qu’on gagne financièrement par mois et par an, il y a de qui on descend et quels étaient les statuts des ancêtres, pauvres ou bourgeois,  il y a bien sûr ce qu’on mange et que les autres ne mangent pas, il y a ces loisirs qui vous distinguent car inaccessibles à beaucoup comme les destinations lointaines de voyages exotiques, il y a enfin ces écoles où on place ses enfants parce qu’elles sont dites meilleures et qu’ils ne s’y “mélangent” pas. Lorsque certains magazines hedomadaires nous fournissent régulièrement un classement  des meilleurs lycées, on sait à quel point la carte scolaire en France est un enjeu dans la formation des futures élites, et que ces cartes sont celles de la ségrégation qu’une société accepte comme allant de soi, même avec les meilleurs sentiments républicains.
Mais il est un critère de classement et de catégorisation encore plus terrible car biologique celui-là : c’est celui de l’âge. Nous ne savons plus penser la société autrement qu’en tranches d’âge, et dès l’enfance, nous voilà accoutumés à distinguer les ‘grands’, les ‘petits’, les vieux’ et les ‘moins vieux’. Les économistes, chaque semaine, nous rappellent le ‘prix de l’âge’ : en France, déjà en 1993, les personnes âgées de 65 ans et plus représentaient 19,6% de la population et accaparaient 41,4% du total des dépenses de santé (Le Monde, 29/05/97). Une nouvelle et subtile discrimination surgit : à l’encontre des vieux cette fois,”dévoreurs” de nos systèmes de santé. Après tout, il faut bien des causes aux déséquilibres constatés, et s’il y a déséquilibre, il y a menace, et s’il y a menace, il y bien des responsables, des fautifs.

Peut-on penser autrement ? Peut-on penser sans classer, sans catégoriser voire opposer ? Et qu’est-ce qu’organiser sinon différencier pour classer ? Ce jeu de différences et de discriminations fait partie de nous ; dès l’origine, du moins très précocément, il est en nous pour que les systèmes qui nous sont naturels, puissent fonctionner. On sait maintenant que dès les premières semaines de la vie, les bébés sont capables de distinguer les sons qui appartiennent à des langues différentes et d’y réagir. Cette capacité précoce va favoriser plus tard l’acquisition de la langue maternelle en tant que système de sons organisés par rapport aux autres bruits environnants.

Suivre

Get every new post delivered to your Inbox.