Espaces sŽmantiques et reprŽsentation du sens

Bernard Victorri

Introduction

Les nouvelles technologies de lÕinformation sont en train de transformer profondŽment la recherche en linguistique. En effet, lÕexistence et la disponibilitŽ de ressources Žlectroniques de grande taille (trs gros corpus, dictionnaires de toute sorte) permettent de dŽvelopper des mŽthodes dՎtude de la langue qui Žtaient encore impensables il y a dix ans.

En particulier, les mŽthodes statistiques, qui Žtaient relŽguŽes ˆ des traitements assez marginaux (analyse de frŽquence lexicale dans des Žtudes de textes, par exemple), ont pris un nouvel essor. Leur r™le dans lÕanalyse syntaxique et sŽmantique des textes occupe une place de plus en plus importante (cf. par exemple, Habert et al. 1997, Habert et al. 1998).

Cela se comprend aisŽment : appliquŽes ˆ des donnŽes massives et diversifiŽes, ces mŽthodes statistiques permettent dՎtudier le fonctionnement de la langue Į en vraie grandeur Č : quÕil sÕagisse de co-occurrences dÕunitŽ lexicales ou dÕacceptabilitŽ de constructions syntaxiques, le linguiste dispose de donnŽes en quantitŽ quasiment illimitŽe, il peut construire des modles basŽs sur lÕanalyse de ces donnŽes, et il peut tester les prŽdictions de ces modles de manire objective et fiable. La linguistique contemporaine, qui a, un moment, cherchŽ ˆ atteindre lÕidŽal de scientificitŽ que reprŽsente la physique thŽorique (cf. Milner 1989, Chomsky 1995) en devenant de plus en plus formelle, est en train dÕacquŽrir un autre statut scientifique, plus expŽrimental et plus proche des sciences biologiques. Cette Žtape est sans doute nŽcessaire pour surmonter lÕimpasse dans laquelle sՎtaient engagŽs un certain nombre de linguistes, plus attirŽs par lՎlŽgance des constructions thŽoriques que par la dure, et parfois dŽcevante, rŽalitŽ des faits linguistiques, qui ne cessent de produire des contre-exemples aux effets dŽvastateurs pour ces tentatives de formalisation.

Notre travail sÕinscrit dans ce nouveau courant en linguistique. En utilisant comme ressource Žlectronique des dictionnaires de synonymes, nous avons cherchŽ ˆ mieux cerner lÕorganisation sŽmantique du lexique du franais, et surtout ˆ concevoir un mode de reprŽsentation du sens des unitŽs lexicales (noms, verbes, adjectifs) qui prenne pleinement en compte la diversitŽ des emplois de ces unitŽs. CÕest donc la polysŽmie, cette propriŽtŽ si commune des mots de pouvoir prendre des sens diffŽrents suivant le contexte dans lequel on les utilise, qui est au cĪur de ce travail.

Le phŽnomne de la polysŽmie

Il faut dÕabord noter que la polysŽmie touche avant tout les mots les plus courants, ceux qui font partie du vocabulaire de base des locuteurs : il suffit dÕouvrir un dictionnaire pour sÕen rendre compte. Plus un mot est utilisŽ dans le langage quotidien, plus il a de chances dՐtre polysŽmique. Qui plus est, ce phŽnomne est universel : il nÕexiste pas de langue humaine qui Žchappe ˆ cette rgle. Il ne sÕagit donc pas dÕun phŽnomne marginal, une sorte de Į dŽfaut Č rŽsiduel de langues imparfaites qui tendraient vers un idŽal o tous les mots ne possderaient plus quÕun seul sens. Au contraire, on doit considŽrer que cÕest une qualitŽ indispensable au bon fonctionnement du langage. Nous avons besoin de la polysŽmie pour pouvoir exprimer ce que nous avons ˆ dire, et, pour notre appareil cognitif, la polysŽmie ne reprŽsente pas une difficultŽ supplŽmentaire ˆ rŽsoudre pour comprendre le sens dÕun ŽnoncŽ : cÕest une caractŽristique Į normale Č dÕun ŽnoncŽ, et les mŽcanismes cognitifs ˆ lÕĪuvre dans la comprŽhension du langage traitent avec la mme facilitŽ les mots polysŽmiques et les mots monosŽmiques. Cette conclusion, surprenante au premier abord, peut tre expliquŽe dans le cadre dÕune conception dynamique de la construction du sens (Victorri 1996).

Pour qui sÕintŽresse au traitement automatique des langues, la polysŽmie constitue une difficultŽ considŽrable. En effet, lister tous les sens possibles dÕun mot dans un lexique informatisŽ sÕavre impraticable : dÕabord parce que ces listes devraient tre pratiquement infinies si lÕon veut tenir compte de toutes les nuances qui peuvent colorer lÕusage dÕun mot, mais aussi et surtout parce que lÕon perd par cette mŽthode ce que ces sens ont en commun, ce qui explique quÕils puissent tre portŽs par une mme unitŽ linguistique, ce qui fait au fond le Į gŽnie Č de la langue qui a produit cette polysŽmie.

Prenons un exemple (tout ˆ fait banal) : le mot peinture. Ce mot peut dŽsigner le matŽriau utilisŽ pour peindre (ex : un pot de peinture), lÕactivitŽ elle-mme (ex : La peinture de la cuisine a pris 3 jours), le rŽsultat de cette activitŽ (La peinture de la cuisine est affreuse), une Īuvre dÕart (une peinture de Picasso), un type dÕactivitŽ (la peinture en b‰timent), ou encore un type de description non picturale qui rappelle lÕactivitŽ de peindre (la peinture des mĪurs). Ces diffŽrentes significations doivent bien sžr tre distinguŽes, et on pourrait les considŽrer comme autant dÕentrŽes sŽparŽes dans un dictionnaire. Mais cela ne suffit pas si lÕon veut une description prŽcise des sens. Ainsi on sÕaccordera sans doute sur la nŽcessitŽ de sŽparer les types dÕactivitŽ, suivant que ce sont des activitŽs industrielles ou artistiques (opposant ainsi la peinture impressionniste ˆ la peinture en b‰timent). JusquÕo doit-on aller ? Doit-on aussi diffŽrencier la peinture dÕun immeuble de la peinture dÕune voiture, qui utilise des procŽdŽs radicalement diffŽrents ? Et o doit-on placer la peinture murale, qui se situe ˆ mi-chemin entre activitŽ artistique et industrielle ? Que faire des peintures sur le corps humain, qui vont du maquillage et du vernis ˆ ongle aux peintures rituelles de tout le corps pratiquŽes dans certaines sociŽtŽs ?

Un autre type de distinction sÕimpose dans le cas o peinture signifie ÔĪuvre dÕartÕ. On peut en effet parler de lÕentitŽ physique (Cette peinture est toute petite) ou du contenu (Cette peinture est trs expressive). Il faut donc sŽparer aussi ces deux sens. Mais comment traiter alors les cas, nombreux, o les deux aspects sont ŽvoquŽs simultanŽment (Cette petite peinture est un vrai chef dÕĪuvre) ? Doit-on diffŽrencier dÕautres aspects, comme par exemple lÕentitŽ Į commerciale Č (Cette peinture est trs chre) ?

On pourrait multiplier les exemples : il est clair que toute tentative dՎlaboration dÕune liste prŽcise et consensuelle des sens dÕun mot se heurte au fait que ces sens forment un continuum et non un ensemble discret, et quÕil y a donc une part dÕarbitraire dans la manire dont on peut dŽcouper ce continuum. De plus, ce type de reprŽsentation occulte la question essentielle que nous avons ŽvoquŽe ci-dessus : si un mot comme peinture devait tre rŽduit ˆ une telle liste de sens, lÕusage de ce mot entra”nerait une charge cognitive insupportable pour les locuteurs qui devraient, chaque fois que ce mot est employŽ, faire lÕeffort de dŽcouvrir quel sens de la liste on doit lui attribuer. Cela ne fonctionne visiblement pas comme cela. Le mot peinture possde un Į potentiel sŽmantique Č unique, qui permet ˆ tout locuteur de construire dynamiquement le sens appropriŽ dans un contexte donnŽ sans avoir ˆ parcourir mentalement la liste de ses diffŽrentes significations comme sÕil sÕagissait dÕun mot dÕune langue Žtrangre dont on rechercherait le sens pertinent en parcourant les diffŽrentes dŽfinitions quÕen donne un dictionnaire.

CÕest pour cette raison que lÕon se tourne de plus en plus vers dÕautres modes de reprŽsentation dÕune unitŽ lexicale, mieux aptes ˆ saisir le potentiel sŽmantique qui lui permet de dŽployer ses diverses significations. Au delˆ des divergences thŽoriques sur la conception du sens[1], les chercheurs en traitement automatique des langues partagent un objectif commun : obtenir des reprŽsentations qui permettent de calculer le sens dÕun mot dans un contexte donnŽ par des mŽcanismes gŽnŽraux, et si possible Į rŽalistes Č, cÕest-ˆ-dire compatibles avec ce que lÕon sait aujourdÕhui du fonctionnement cognitif de la comprŽhension du langage.

Dans notre laboratoire, nous avons conu dans cet esprit un modle de la polysŽmie (Victorri et Fuchs 1996), utilisant la thŽorie mathŽmatique des systmes dynamiques pour modŽliser la construction du sens dÕun ŽnoncŽ. Dans ce modle, on associe ˆ toute unitŽ polysŽmique un Į espace sŽmantique Č, et le sens de lÕunitŽ dans un ŽnoncŽ donnŽ est reprŽsentŽ par une rŽgion de lÕespace sŽmantique. CÕest donc une approche continue du sens qui Žvite les difficultŽs engendrŽes par les reprŽsentations discrtes.

Espaces sŽmantiques

Pour illustrer la notion dÕespace sŽmantique, reprenons lÕexemple de peinture. Ses divers sens se distinguent par des valeurs diffŽrentes dÕun certain nombre de paramtres, que lÕon peut considŽrer comme autant de dimensions de lÕespace que lÕon va associer ˆ ce mot. Ainsi on pourrait construire un espace quadridimensionnel permettant de reprŽsenter les variations des quatre paramtres suivants :

1. Un paramtre correspondant ˆ la Ônature du rŽfŽrentÕ, pouvant prendre les valeurs ÔmatŽriauÕ, ÔactivitŽÕ et ÔrŽsultatÕ. LÕordre dans lequel ces valeurs seront disposŽes sur la dimension correspondante est important : Il y a une plus grande proximitŽ sŽmantique entre ÔmatŽriauÕ et ÔactivitŽÕ dÕune part, et entre ÔactivitŽÕ et ÔrŽsultatÕ dÕautre part. Il faut donc placer la valeur ÔactivitŽÕ au centre, pour respecter ces relations de voisinage topologique[2].

2. Un paramtre correspondant au Ôpoint de vue sur lÕentitŽÕ, qui varie suivant que lÕon Žvoque lÕaspect ÔphysiqueÕ, ÔcommercialÕ ou ÔsignifiantÕ de lÕentitŽ dŽsignŽe par peinture. Lˆ encore lÕordre est important, lÕaspect commercial se situant naturellement entre les deux autres dans le continuum ainsi dŽfini.

3. Un paramtre ÔdomaineÕ qui peut prendre les valeurs ÔindustrielÕ, ÔartisanalÕ et ÔartistiqueÕ, toujours en respectant une gradation sŽmantiquement motivŽe.

4. Enfin un paramtre Ôtype de reprŽsentationÕ qui permet de diffŽrencier lÕactivitŽ picturale proprement dite des autres formes de description, langagires notamment, qui correspondent ˆ des sens Į figurŽs Č de peinture (comme dans la peinture des mĪurs).

Dans cet espace, le sens de peinture dans un ŽnoncŽ donnŽ peut tre reprŽsentŽ avec prŽcision par une rŽgion de lÕespace : la rŽgion sera plus ou moins grande dans une dimension donnŽe suivant que le paramtre correspondant sera plus ou moins bien dŽterminŽ, et les sens intermŽdiaires trouveront leur place exacte dans le continuum de valeurs que peut prendre chaque paramtre. Cette reprŽsentation respecte les proximitŽs de sens en les traduisant par des relations topologiques de voisinage et de recouvrement partiel entre les rŽgions correspondantes de lÕespace sŽmantique.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Figure 1 : Exemple dÕespace sŽmantique

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Figure 2 : ReprŽsentation dÕune ambigu•tŽ alternative

 

 

Ainsi, si lÕon se rŽfre ˆ la figure 1, o lÕon a reprŽsentŽ les deux premires dimensions de cet espace, on peut voir les rŽgions associŽes ˆ quelques unes des occurrences possibles de peinture. Comme on peut le constater, une peinture de Picasso, en lÕabsence de tout contexte plus prŽcis, occupe une rŽgion qui couvre toute la dimension Ôpoint de vue sur lÕentitŽÕ, puisque tous les aspects de lÕentitŽ sont a priori pertinents, alors que une peinture expressive est localisŽe plus prŽcisŽment sur cet axe, puisque seule lÕentitŽ signifiante est ŽvoquŽe par cette expression.

Bien entendu, la prise en compte de la troisime dimension conduirait ˆ mieux localiser ces rŽgions : ainsi un pot de peinture se situerait dans la partie Ôdomaine industrielÕ sur cette dimension alors que une peinture de Picasso occuperait la partie Ôdomaine artistiqueÕ.

Il faut noter que cette reprŽsentation permet de aussi traiter les ambigu•tŽs alternatives comme un cas de figure spŽcifique, diffŽrent des cas de plus ou moins grande indŽtermination. Prenons lÕexemple de la phrase : Pierre a achetŽ une belle peinture. En dehors de tout contexte, il peut sÕagir dÕun matŽriau ou dÕun tableau. Dans ce cas, la rŽgion associŽe ˆ peinture sera constituŽe de deux sous-rŽgions sŽparŽes (Į non connexes Č, en termes mathŽmatiques) dans lÕespace sŽmantique, comme on peut le voir figure 2.

Le logiciel Visusyn

Ce type de reprŽsentation rend donc mieux compte de la complexitŽ des phŽnomnes de polysŽmie. Associer ˆ chaque unitŽ polysŽmique un espace sŽmantique plut™t quÕune liste de sens permet de dŽterminer avec prŽcision le sens de chaque acception du terme ŽtudiŽ sans pour autant Žcarter la notion de proximitŽ sŽmantique qui joue un r™le essentiel dans la dŽfinition mme de la polysŽmie. De plus les diffŽrents Į cas de figure Č interprŽtatifs (sens prŽcis, indŽtermination, ambigu•tŽ alternative) correspondent ˆ de vŽritables cas de figure gŽomŽtriques dans lÕespace associŽ, et cÕest prŽcisŽment sur cette base que lÕon peut construire un modle dynamique de construction du sens. Dans le modle que nous avons conu (cf. Victorri et Fuchs 1996), les rŽgions correspondant au sens dÕune unitŽ dans un ŽnoncŽ donnŽ sont obtenues ˆ partir des bassins dÕattracteurs dÕune dynamique dŽpendant des ŽlŽments contextuels prŽsents dans cet ŽnoncŽ. Ce modle mathŽmatique a ŽtŽ implŽmentŽ sur ordinateur ˆ lÕaide dÕun rŽseau connexionniste fonctionnant par apprentissage, et nous avons pu montrer sur un exemple (le mot encore) que lÕon pouvait ainsi calculer automatiquement le sens dÕune unitŽ polysŽmique dans nÕimporte quel ŽnoncŽ qui la contient.

Mais lÕapplication de cette mŽthode dans le traitement automatique des langues pose un problme redoutable. En effet, il faut, pour chaque unitŽ polysŽmique de la langue, construire dÕabord lÕespace sŽmantique correspondant qui va tre Į codŽ Č dans le rŽseau connexionniste. Comme on lÕa vu avec lÕexemple de peinture, ce travail de construction de lÕespace ne prŽsente pas de difficultŽ thŽorique particulire, mais il rŽclame une analyse linguistique spŽcifique pour chacune des unitŽs lexicales de la langue. Etant donnŽ le nombre des mots polysŽmiques dÕune langue, il est irrŽaliste dÕespŽrer pouvoir disposer dÕune reprŽsentation de chacun de ces mots en un temps raisonnable.

CÕest pourquoi nous avons cherchŽ ˆ automatiser ce processus en utilisant une ressource Žlectronique : un dictionnaire Žlectronique de synonymes du franais[3]. Ce dictionnaire contient prs de 50 000 entrŽes et 400 000 relations synonymiques. La base de dŽpart est constituŽe de sept dictionnaires classiques (Bailly, Benac, Du Chazaud, Guizot, Lafaye, Larousse et Robert) dont ont ŽtŽ extraites les relations synonymiques qui ont ŽtŽ ensuite regroupŽes et homogŽnŽisŽes. Les relations rŽpertoriŽes dans ces dictionnaires sont des relations de synonymie partielle : pour que deux unitŽs soient dites synonymes, il suffit quÕelles aient des sens trs proches dans certains de leurs emplois, mme si elles prennent des sens trs diffŽrents dans dÕautres contextes. Par exemple peinture et tableau, qui sont loin de partager tous leurs sens, sont considŽrŽs comme synonymes, parce quÕil existe des contextes o peinture peut tre remplacŽ par tableau, et vice versa, sans changement notable de sens (cÕest vrai aussi bien pour une peinture de Picasso que pour la peinture des mĪurs).

Ainsi chaque synonyme ne couvre quÕune partie des emplois dÕun mot donnŽ et ne reprŽsente donc quÕune partie de lÕespace sŽmantique que lÕon cherche ˆ construire. En revanche, si lÕon considre lÕensemble des synonymes du mot, on doit obtenir un recouvrement de lÕespace sŽmantique. Qui plus est, cet ensemble de synonymes est structurŽ, puisque lÕon sait, pour chaque couple de synonymes du mot ŽtudiŽ, si ces deux unitŽs sont elles-mmes synonymes entre elles ou non. En termes mathŽmatiques, on dispose de la structure du graphe constituŽ par la relation de synonymie. En particulier, on peut obtenir ce que lÕon appelle les Į cliques Č du graphe, cÕest-ˆ-dire les sous-ensembles[4] de synonymes du mot qui sont tous synonymes entre eux deux ˆ deux. Ce sont ces cliques qui vont nous permettre de construire lÕespace sŽmantique.

Pour tre concret, reprenons lÕexemple de peinture. Le dictionnaire nous donne 52 synonymes, tels que couleur, barbouillage, fresque, crožte, toile, portrait, tableau, description, reprŽsentation, etc., qui couvrent assez bien tous les sens de peinture. Parmi eux, certains sont synonymes entre eux, comme toile et tableau, description et tableau, reprŽsentation et tableau, reprŽsentation et description, et dÕautres ne le sont pas, comme toile et description, par exemple. Parmi les cliques du graphe, on aura donc au moins les deux cliques suivantes :

- peinture, tableau, toile.

- peinture, tableau, reprŽsentation, description[5].

Comme on peut le constater, ces deux cliques caractŽrisent deux sens prŽcis de peinture : la premire, le sens concret dÕĪuvre dÕart picturale (une peinture de Picasso), et la deuxime, le sens plus abstrait de description non picturale (la peinture des mĪurs). Si lÕon calcule toutes les cliques du graphe de peinture, on obtient 49 cliques maximales, qui caractŽrisent chacune un sens prŽcis de peinture. En voici quelques exemples supplŽmentaires :

- peinture, enduit, revtement.

- peinture, badigeonnage, barbouillage.- peinture, barbouillage, crožte.- peinture, couleur, gouache.- peinture, couleur, fard.- peinture, aquarelle, gouache, image.etc.

Les cliques peuvent donc tre considŽrŽes comme de toutes petites rŽgions, que lÕon peut assimiler ˆ des points, de lÕespace sŽmantique que lÕon cherche ˆ construire, puisquÕelles dŽfinissent des sens trs Žtroits de lÕunitŽ polysŽmique ŽtudiŽ. En revanche, les synonymes occupent des rŽgions beaucoup plus larges, puisquÕun mme synonyme peut participer ˆ de nombreuses cliques. En dÕautres termes, la donnŽe dÕun seul synonyme ne suffit pas ˆ prŽciser suffisamment le sens (que lÕon pense ˆ tableau, par exemple), alors que la donnŽe dÕune clique le permet.

Partant de ce constat, nous avons conu un algorithme de construction de lÕespace sŽmantique en dŽfinissant une distance entre cliques, considŽrŽes donc comme des points de lÕespace ˆ construire[6]. Cet espace comporte un grand nombre de dimensions, mais on peut obtenir, par des algorithmes classiques de dŽcomposition en composantes principales, des visualisations assez fidles sur un nombre rŽduit de dimensions. Nous avons rŽalisŽ un logiciel, Visusyn, qui permet dÕeffectuer lÕensemble de ces opŽrations. Ainsi, pour peinture, on peut voir figure 3 une projection bidimensionnelle de lÕespace obtenu par Visusyn.

Comme on peut le constater, les cliques, reprŽsentŽes par des points, sÕorganisent suivant une certaine structure topologique : des points proches correspondent ˆ des cliques de sens voisins. En premire approximation, on peut estimer que ces points se situent le long dÕune courbe, et que, si lÕon parcourt cette courbe dÕune extrŽmitŽ ˆ lÕautre, on passe successivement par les sens ÔmatŽriauÕ, ÔactivitŽÕ, ÔĪuvre dÕartÕ et ÔdescriptionÕ.

Sur la figure 4, on a reprŽsentŽ les rŽgions correspondant ˆ trois synonymes de peinture, choisis ˆ titre dÕexemple : barbouillage, portrait et tableau. Comme on pouvait sÕy attendre, ces synonymes occupent des rŽgions plus ou moins vastes de lÕespace sŽmantique, suivant le degrŽ de prŽcision avec lequel ils spŽcifient le sens de peinture. On a aussi reprŽsentŽ deux sens largement sous-dŽterminŽs de peinture : une peinture chre (qui peut sÕappliquer aussi bien au matŽriau quՈ une Īuvre dÕart) et une peinture expressive (qui peut sÕappliquer ˆ une Īuvre dÕart ou ˆ une description non picturale).

Il faut noter que cette reprŽsentation est particulirement Žconomique : puisque lÕon peut, en premire approximation, considŽrer que lÕespace sŽmantique se rŽduit ˆ une courbe (variŽtŽ ˆ une dimension), cela veut dire que lÕon peut reprŽsenter les principales variations de sens de peinture par un seul paramtre (lÕabscisse curviligne sur cette courbe). Si lÕon compare le rŽsultat obtenu ˆ lÕanalyse linguistique prŽsentŽe ˆ la section prŽcŽdente, on remarque que la reprŽsentation automatique, tout en Žtant plus frustre, prŽserve une partie essentielle des distinctions que nous avions mises ˆ jour. Cette reprŽsentation trs simplifiŽe peut donc tre suffisante pour de nombreuses applications en traitement automatique. De plus, si lÕon a besoin de plus de finesse, rien dÕempche dÕutiliser plus de dimensions, puisque, ne lÕoublions pas, la reprŽsentation bidimensionnelle de la figure 3 nÕest quÕune projection de lÕespace sŽmantique multidimensionnel construit par le systme.

Ainsi, on dispose dÕune mŽthode informatique pour construire un espace sŽmantique associŽ ˆ nÕimporte quelle unitŽ polysŽmique de la langue. Mme si les reprŽsentations ne sont pas parfaites, cette mŽthode, parce quÕelle est entirement automatique, permet de concevoir des applications informatiques qui seraient inenvisageables sans cela. Cet outil peut aussi fournir une aide prŽcieuse aux lexicographes et aux spŽcialistes de sŽmantique lexicale. En effet, comme nous allons le voir, lÕexamen de la structure de lÕespace sŽmantique obtenu peut contribuer de manire significative ˆ la comprŽhension de la polysŽmie dÕun mot.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Figure 3 : ReprŽsentation des cliques de peinture

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Figure 4 : ReprŽsentation de quelques synonymes et sens de peinture

 

Un outil pour lÕanalyse linguistique

Pour illustrer lÕintŽrt de Visusyn pour lÕanalyse linguistique, nous avons choisi lÕexemple du verbe jouer. Ce verbe est fortement polysŽmique, comme le montre les quelques exemples suivants :

Les enfants jouent dans la cour.

Pierre joue aux Žchecs.

Pierre joue en bourse.

Marie joue Andromaque.

Marie joue du piano.

Marie joue des coudes.

Pierre joue les innocents.

Pierre nous a jouŽ un sale tour.

La porte joue sur ses gonds.

La barque joue sur son ancre.

etc.

Pourtant, au delˆ de cette diversitŽ de sens, il semble bien que ce verbe prŽsente une certaine unitŽ sŽmantique, mme si celle-ci nÕest pas facile ˆ dŽfinir. Comme le dit Pierre Cadiot dans la conclusion dÕun article quÕil a consacrŽ ˆ ce verbe (Cadiot 1998) :

Į Cette diversitŽ de sens couplŽe ˆ des propriŽtŽs formelles partiellement diffŽrenciantes pousse naturellement vers une vision dŽgroupante ou homonymique. Aprs tout, il peut para”tre fort peu naturel de chercher ˆ maintenir un sens commun ˆ se jouer des obstacles et jouer les incompris, jouer ˆ la marelle et jouer de malchance, jouer un cheval et jouer sur les nerfs de quelquÕun, etc. Les dŽgroupements des autres langues parlent aussi contre cette volontŽ de trouver ˆ tout prix un sens commun. Pourtant, cÕest bien notre intuition de locuteurs natifs qui nous pousse dans la voie inverse : celle dÕun sens de base unique. Au delˆ de lÕintuition, nous avons montrŽ ici que la diversitŽ des effets de sens Žtait en corrŽlation avec des contraintes ou conditions externes systŽmatiques. [É]. Il reste ˆ trouver un noyau stable de sens, une sorte dÕinstruction ou de schŽma de base. Č

Pierre Cadiot propose ensuite quelques pistes pour dŽfinir ce schŽma de base. Nous les discuterons plus bas, mais auparavant, nous allons examiner les rŽsultats fournis par Visusyn, pour montrer comment cet outil peut aider ˆ analyser la structure polysŽmique dÕune unitŽ lexicale.

Le verbe jouer possde 94 synonymes dans notre dictionnaire Žlectronique, et ces synonymes forment 98 cliques, ce qui correspond bien au haut degrŽ de polysŽmie de ce verbe. On trouvera figure 5 la projection bidimensionnelle de lÕespace sŽmantique construit par Visusyn. LÕexamen de la figure[7] permet de faire plusieurs observations intŽressantes :

- On remarque dÕabord quÕil nÕy a pas de Į dŽgroupement Č notable des sens : on passe dÕun sens ˆ lÕautre de manire continue, ce qui milite en faveur dÕune unitŽ sŽmantique de jouer, comme le propose Pierre Cadiot.

- Les diverses significations de jouer sÕorganisent selon deux axes (cf. figure 6). LÕaxe vertical fait passer progressivement de valeurs o jouer dŽsigne une activitŽ que lÕon exerce aux dŽpens dÕautrui (berner, duper, mystifier) ˆ des valeurs o, au contraire, lÕactivitŽ sÕexerce ˆ ses propres dŽpens (hasarder, risquer, miser). Sur lÕaxe horizontal, on passe de valeurs o lÕactivitŽ est centrŽe sur le sujet (se divertir, rire, fol‰trer) ˆ des valeurs opposŽes o lÕactivitŽ consiste ˆ se projeter sur autrui (copier, imiter, simuler).

- Au centre de lÕespace sŽmantique, on trouve des valeurs Į neutres Č pour les dimensions subjectives portŽes par les deux axes. CÕest notamment dans cette zone que lÕon trouve les sens de jouer dans lesquels il dŽsigne une activitŽ non intentionnelle (La porte joue sur ses gonds, La barque joue sur son ancre, etc.).

Cette dernire remarque peut nous permettre de dŽcouvrir ce qui fait lÕunitŽ du sŽmantisme de jouer. En effet, on peut faire lÕhypothse que ces valeurs neutres reprŽsentent un sens de base dont les traits essentiels seraient partagŽs par tous les sens du verbe. LՎtude de ce sens de base peut donc se rŽvŽler trs prŽcieuse pour lÕanalyse sŽmantique du verbe.

Or dans ce type dÕemplois, jouer dŽsigne une activitŽ qui sÕexerce selon des degrŽs de libertŽ Į non standards Č, non prŽvus par le dispositif en question. Une porte est faite pour tourner autour dÕun axe. Quand elle joue sur ses gonds, cela signifie quՈ ce mouvement de rotation Į normal Č se superpose un mouvement non prŽvu de translation verticale qui reprŽsente une libertŽ supplŽmentaire pour le mŽcanisme.

Il est clair que cette caractŽristique est prŽsente dans tous les sens du verbe jouer. Dans tous les cas, jouer dŽsigne une activitŽ qui sÕoppose ˆ une activitŽ rŽgulire, programmŽe, en ouvrant des degrŽs de libertŽ sur lesquels cette nouvelle activitŽ peut sÕexercer. Cela ne veut pas dire que cette nouvelle activitŽ ne soit pas elle-mme rŽgulŽe (que lÕon joue aux Žchecs, au football, au thމtre, ou encore aux courses). Mais les rgles de cette activitŽ de jeu, quand elles existent, sÕinscrivent dans un espace de libertŽ qui nÕa plus rien ˆ voir avec le fonctionnement de lÕactivitŽ normale ˆ laquelle elle sÕoppose.

Il est remarquable que la dŽfinition que nous venons de donner pour jouer rejoigne pour lÕessentiel les rŽflexions de Pierre Cadiot dans lÕarticle que nous avons citŽ. En effet, au terme de son analyse, il propose de construire le schŽma de base associŽ ˆ jouer autour de deux notions de Į dŽdoublement Č et de Į marge Č :

Į Le dŽdoublement semble une condition de base. Il faut que le jeu sÕoppose ˆ une activitŽ prŽsentŽe comme plus normale et rŽgulire. [É]. Une marge qui est une rupture dans la contrainte dÕune programmation ou dÕune attente, ŽprouvŽe surtout Đmais pas seulement- dans sa dimension temporelle Č.

Ainsi, cet exemple montre que les reprŽsentations obtenues par Visusyn sont pertinentes pour lÕanalyse sŽmantique de la polysŽmie. Bien entendu, ce nÕest quÕun outil qui ne saurait se substituer au travail du linguiste. En particulier, il ne prend pas en compte le niveau syntaxique, dont lÕimportance est primordiale pour Žtudier le dŽploiement des sens dÕune unitŽ polysŽmique, comme le montre Pierre Cadiot dans son article. Mais cÕest un outil puissant, qui fait clairement ressortir la structure sŽmantique dÕune unitŽ lexicale ˆ partir des relations paradigmatiques que lÕunitŽ ŽtudiŽe entretient avec les mots de sens voisins. A ce titre, il constitue une aide trs prŽcieuse pour les sŽmanticiens et les lexicographes.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Figure 5 : Espace sŽmantique associŽ ˆ jouer

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

agir aux dŽpens dÕautrui

 
 

 

 


Figure 6 : Structure de lÕespace sŽmantique associŽ ˆ jouer

 

 


Conclusion

Comme on lÕa vu, Visusyn permet dÕobtenir des reprŽsentations des unitŽs lexicales qui peuvent tre exploitŽes aussi bien par les concepteurs de systmes de traitement automatique du calcul du sens que par les linguistes spŽcialistes de la polysŽmie. Outre son intŽrt pour les applications informatiques et la recherche linguistique, ce logiciel permet aussi aux simples usagers et amoureux de la langue de visualiser dÕun seul coup dÕĪil le dŽploiement des sens dÕun mot donnŽ, et de saisir les principes qui rŽgissent ce dŽploiement.

LÕune des applications sans doute les plus prometteuses de ces techniques concerne le domaine de la traduction. En effet, on peut Žtendre la relation de synonymie interne ˆ une langue ˆ une relation entre langues, deux mots de langue diffŽrente Žtant considŽrŽs comme synonymes sÕils sont des traductions possibles lÕun de lÕautre. Si lÕon dispose de dictionnaires de synonymes pour chacune des langues, ainsi que des dictionnaires bilingues correspondants, on peut donc, en utilisant les mmes algorithmes, construire un espace sŽmantique pour un mot dans lequel ses traductions dans une langue cible occuperont des rŽgions de lÕespace. On obtient donc en outil dÕaide ˆ la traduction, qui prŽsente visuellement une cartographie des sens dÕun mot dans la langue source auxquels sont associŽes les traductions pertinentes dans la langue cible. Sabine Ploux a ainsi constituŽ ce quÕelle appelle des Į atlas sŽmantiques Č pour le franais et lÕanglais[8].

Ces travaux montrent tout lÕintŽrt de lÕutilisation des nouvelles technologies dans le domaine de lՎtude de la langue. Ce champ de recherche pluridisciplinaire, qui mobilise des mathŽmaticiens, des informaticiens et des linguistes, est aujourdÕhui en pleine expansion. En produisant de nouveaux outils dÕapprŽhension et de ma”trise des phŽnomnes linguistiques, ces recherches vont sans aucun doute contribuer ˆ transformer substantiellement notre relation ˆ la langue et au texte.

Bibliographie

Cadiot P. (1998) : Les sens de jouer : esquisse d'une approche par le biais des attaches prŽpositionnelles, PrŽpositions et rection verbale, Presse Universitaire de Reims, 11:105-129.

Chomsky N. (1995) : Language and Nature,. Mind, 104 :1-61.

Habert B., Nazarenko A. et Salem A. (1997) : Les linguistiques de corpus. Paris, Armand Colin.

Habert B., Fabre C. et Issac F. (1998) : De l'Žcrit au numŽrique : constituer, normaliser, exploiter les corpus Žlectroniques. Paris, Interƒditions.

Kleiber G. (1999) : Problmes de sŽmantique Đ La polysŽmie en questions, Villeneuve dÕAscq, Septentrion.

Milner J.-C. (1989) : Introduction ˆ une science du langage, Paris, Seuil.

Ploux S., Victorri B. (1998) : Construction dÕespaces sŽmantiques ˆ lÕaide de dictionnaires de synonymes, Traitement automatique des langues, 39/1 :161-182.

Victorri B. (sous presse) : Langage et cognition : le malentendu cognitiviste, Des lois de la pensŽe au constructivisme, M.J. Durand Richard Žd., Paris, Maison des Sciences de lÕHomme.

Victorri B., Fuchs C. (1996) : La polysŽmie Đ Construction dynamique du sens, Paris, Herms.



[1] Pour une discussion des diffŽrentes approches thŽoriques contemporaines en sŽmantique lexicale, voir Kleiber 1999.

[2] On pourrait juger que ces trois valeurs sont en fait ˆ Žgale distance les une des autres. Dans ce cas, on choisira une reprŽsentation circulaire pour cette dimension. Nous nÕentrerons pas ici dans les dŽtails, mais cela ne pose aucun problme si lÕon dŽfinit mathŽmatiquement lÕespace sŽmantique comme une variŽtŽ diffŽrentiable (cf. Victorri et Fuchs 1996).

[3] Ce dictionnaire a ŽtŽ rŽalisŽ par Sabine Ploux au laboratoire de linguistique de lÕUniversitŽ de Caen. Il existe aujourdÕhui deux versions de ce dictionnaire consultables sur le Web aux adresses suivantes :

- http://elsap1.unicaen.fr/dicosyn.html : site conu et gŽrŽ par Jean-Luc Manguin ˆ lÕUniversitŽ de Caen ;

- http://dico.isc.cnrs.fr/ : site conu et gŽrŽ par Sabine Ploux ˆ lÕInstitut des Sciences Cognitives de Lyon.

[4] Plus prŽcisŽment, ce sont les sous-ensembles maximaux de tels synonymes qui nous intŽressent (les sous-graphes complets maximaux, en termes mathŽmatiques).

[5] Nous avons quelque peu simplifiŽ cet exemple pour ne pas alourdir la prŽsentation. La clique maximale correspondante est en fait constituŽe de peinture, tableau, reprŽsentation, description, fresque, image, portrait. 

[6] On trouvera tous les dŽtails de cet algorithme dans Ploux et Victorri 1998.

Signalons aussi que lÕon peut consulter la liste des cliques dÕun mot quelconque ainsi quÕune visualisation de lÕespace sŽmantique correspondant sur les deux sites Web rŽfŽrencŽs ci-dessus (note 3).

[7] Dans la figure 5, on nÕa pas fait figurer le verbe jouer dans les Žtiquettes associŽes aux cliques, uniquement pour des raisons de lisibilitŽ du graphique, mais bien sžr jouer appartient ˆ chacune des cliques reprŽsentŽes.

[8] Ces outils sont consultables sur le Web ˆ lÕadresse dŽjˆ citŽe : http://dico.isc.cnrs.fr/.