Les nouvelles technologies de lÕinformation sont en train de transformer profondment la recherche en linguistique. En effet, lÕexistence et la disponibilit de ressources lectroniques de grande taille (trs gros corpus, dictionnaires de toute sorte) permettent de dvelopper des mthodes dÕtude de la langue qui taient encore impensables il y a dix ans.
En particulier, les mthodes statistiques, qui taient relgues des traitements assez marginaux (analyse de frquence lexicale dans des tudes de textes, par exemple), ont pris un nouvel essor. Leur rle dans lÕanalyse syntaxique et smantique des textes occupe une place de plus en plus importante (cf. par exemple, Habert et al. 1997, Habert et al. 1998).
Cela se comprend aisment : appliques des donnes massives et diversifies, ces mthodes statistiques permettent dÕtudier le fonctionnement de la langue Į en vraie grandeur Č : quÕil sÕagisse de co-occurrences dÕunit lexicales ou dÕacceptabilit de constructions syntaxiques, le linguiste dispose de donnes en quantit quasiment illimite, il peut construire des modles bass sur lÕanalyse de ces donnes, et il peut tester les prdictions de ces modles de manire objective et fiable. La linguistique contemporaine, qui a, un moment, cherch atteindre lÕidal de scientificit que reprsente la physique thorique (cf. Milner 1989, Chomsky 1995) en devenant de plus en plus formelle, est en train dÕacqurir un autre statut scientifique, plus exprimental et plus proche des sciences biologiques. Cette tape est sans doute ncessaire pour surmonter lÕimpasse dans laquelle sÕtaient engags un certain nombre de linguistes, plus attirs par lÕlgance des constructions thoriques que par la dure, et parfois dcevante, ralit des faits linguistiques, qui ne cessent de produire des contre-exemples aux effets dvastateurs pour ces tentatives de formalisation.
Notre travail sÕinscrit dans ce nouveau courant en linguistique. En utilisant comme ressource lectronique des dictionnaires de synonymes, nous avons cherch mieux cerner lÕorganisation smantique du lexique du franais, et surtout concevoir un mode de reprsentation du sens des units lexicales (noms, verbes, adjectifs) qui prenne pleinement en compte la diversit des emplois de ces units. CÕest donc la polysmie, cette proprit si commune des mots de pouvoir prendre des sens diffrents suivant le contexte dans lequel on les utilise, qui est au cĪur de ce travail.
Il faut dÕabord noter que la polysmie touche avant tout les mots les plus courants, ceux qui font partie du vocabulaire de base des locuteurs : il suffit dÕouvrir un dictionnaire pour sÕen rendre compte. Plus un mot est utilis dans le langage quotidien, plus il a de chances dÕtre polysmique. Qui plus est, ce phnomne est universel : il nÕexiste pas de langue humaine qui chappe cette rgle. Il ne sÕagit donc pas dÕun phnomne marginal, une sorte de Į dfaut Č rsiduel de langues imparfaites qui tendraient vers un idal o tous les mots ne possderaient plus quÕun seul sens. Au contraire, on doit considrer que cÕest une qualit indispensable au bon fonctionnement du langage. Nous avons besoin de la polysmie pour pouvoir exprimer ce que nous avons dire, et, pour notre appareil cognitif, la polysmie ne reprsente pas une difficult supplmentaire rsoudre pour comprendre le sens dÕun nonc : cÕest une caractristique Į normale Č dÕun nonc, et les mcanismes cognitifs lÕĪuvre dans la comprhension du langage traitent avec la mme facilit les mots polysmiques et les mots monosmiques. Cette conclusion, surprenante au premier abord, peut tre explique dans le cadre dÕune conception dynamique de la construction du sens (Victorri 1996).
Pour qui sÕintresse au traitement automatique des langues, la polysmie constitue une difficult considrable. En effet, lister tous les sens possibles dÕun mot dans un lexique informatis sÕavre impraticable : dÕabord parce que ces listes devraient tre pratiquement infinies si lÕon veut tenir compte de toutes les nuances qui peuvent colorer lÕusage dÕun mot, mais aussi et surtout parce que lÕon perd par cette mthode ce que ces sens ont en commun, ce qui explique quÕils puissent tre ports par une mme unit linguistique, ce qui fait au fond le Į gnie Č de la langue qui a produit cette polysmie.
Prenons un exemple (tout fait banal) : le mot peinture. Ce mot peut dsigner le matriau utilis pour peindre (ex : un pot de peinture), lÕactivit elle-mme (ex : La peinture de la cuisine a pris 3 jours), le rsultat de cette activit (La peinture de la cuisine est affreuse), une Īuvre dÕart (une peinture de Picasso), un type dÕactivit (la peinture en btiment), ou encore un type de description non picturale qui rappelle lÕactivit de peindre (la peinture des mĪurs). Ces diffrentes significations doivent bien sr tre distingues, et on pourrait les considrer comme autant dÕentres spares dans un dictionnaire. Mais cela ne suffit pas si lÕon veut une description prcise des sens. Ainsi on sÕaccordera sans doute sur la ncessit de sparer les types dÕactivit, suivant que ce sont des activits industrielles ou artistiques (opposant ainsi la peinture impressionniste la peinture en btiment). JusquÕo doit-on aller ? Doit-on aussi diffrencier la peinture dÕun immeuble de la peinture dÕune voiture, qui utilise des procds radicalement diffrents ? Et o doit-on placer la peinture murale, qui se situe mi-chemin entre activit artistique et industrielle ? Que faire des peintures sur le corps humain, qui vont du maquillage et du vernis ongle aux peintures rituelles de tout le corps pratiques dans certaines socits ?
Un autre type de distinction sÕimpose dans le cas o peinture signifie ÔĪuvre dÕartÕ. On peut en effet parler de lÕentit physique (Cette peinture est toute petite) ou du contenu (Cette peinture est trs expressive). Il faut donc sparer aussi ces deux sens. Mais comment traiter alors les cas, nombreux, o les deux aspects sont voqus simultanment (Cette petite peinture est un vrai chef dÕĪuvre) ? Doit-on diffrencier dÕautres aspects, comme par exemple lÕentit Į commerciale Č (Cette peinture est trs chre) ?
On pourrait multiplier les exemples : il est clair que toute tentative dÕlaboration dÕune liste prcise et consensuelle des sens dÕun mot se heurte au fait que ces sens forment un continuum et non un ensemble discret, et quÕil y a donc une part dÕarbitraire dans la manire dont on peut dcouper ce continuum. De plus, ce type de reprsentation occulte la question essentielle que nous avons voque ci-dessus : si un mot comme peinture devait tre rduit une telle liste de sens, lÕusage de ce mot entranerait une charge cognitive insupportable pour les locuteurs qui devraient, chaque fois que ce mot est employ, faire lÕeffort de dcouvrir quel sens de la liste on doit lui attribuer. Cela ne fonctionne visiblement pas comme cela. Le mot peinture possde un Į potentiel smantique Č unique, qui permet tout locuteur de construire dynamiquement le sens appropri dans un contexte donn sans avoir parcourir mentalement la liste de ses diffrentes significations comme sÕil sÕagissait dÕun mot dÕune langue trangre dont on rechercherait le sens pertinent en parcourant les diffrentes dfinitions quÕen donne un dictionnaire.
CÕest pour cette raison que lÕon se tourne de plus en plus vers dÕautres modes de reprsentation dÕune unit lexicale, mieux aptes saisir le potentiel smantique qui lui permet de dployer ses diverses significations. Au del des divergences thoriques sur la conception du sens[1], les chercheurs en traitement automatique des langues partagent un objectif commun : obtenir des reprsentations qui permettent de calculer le sens dÕun mot dans un contexte donn par des mcanismes gnraux, et si possible Į ralistes Č, cÕest--dire compatibles avec ce que lÕon sait aujourdÕhui du fonctionnement cognitif de la comprhension du langage.
Dans notre laboratoire, nous avons conu dans cet esprit un modle de la polysmie (Victorri et Fuchs 1996), utilisant la thorie mathmatique des systmes dynamiques pour modliser la construction du sens dÕun nonc. Dans ce modle, on associe toute unit polysmique un Į espace smantique Č, et le sens de lÕunit dans un nonc donn est reprsent par une rgion de lÕespace smantique. CÕest donc une approche continue du sens qui vite les difficults engendres par les reprsentations discrtes.
Pour illustrer la notion dÕespace smantique, reprenons lÕexemple de peinture. Ses divers sens se distinguent par des valeurs diffrentes dÕun certain nombre de paramtres, que lÕon peut considrer comme autant de dimensions de lÕespace que lÕon va associer ce mot. Ainsi on pourrait construire un espace quadridimensionnel permettant de reprsenter les variations des quatre paramtres suivants :
1. Un paramtre correspondant la Ônature du rfrentÕ, pouvant prendre les valeurs ÔmatriauÕ, ÔactivitÕ et ÔrsultatÕ. LÕordre dans lequel ces valeurs seront disposes sur la dimension correspondante est important : Il y a une plus grande proximit smantique entre ÔmatriauÕ et ÔactivitÕ dÕune part, et entre ÔactivitÕ et ÔrsultatÕ dÕautre part. Il faut donc placer la valeur ÔactivitÕ au centre, pour respecter ces relations de voisinage topologique[2].
2. Un paramtre correspondant au Ôpoint de vue sur lÕentitÕ, qui varie suivant que lÕon voque lÕaspect ÔphysiqueÕ, ÔcommercialÕ ou ÔsignifiantÕ de lÕentit dsigne par peinture. L encore lÕordre est important, lÕaspect commercial se situant naturellement entre les deux autres dans le continuum ainsi dfini.
3. Un paramtre ÔdomaineÕ qui peut prendre les valeurs ÔindustrielÕ, ÔartisanalÕ et ÔartistiqueÕ, toujours en respectant une gradation smantiquement motive.
4. Enfin un paramtre Ôtype de reprsentationÕ qui permet de diffrencier lÕactivit picturale proprement dite des autres formes de description, langagires notamment, qui correspondent des sens Į figurs Č de peinture (comme dans la peinture des mĪurs).
Dans cet espace, le sens de peinture dans un nonc donn peut tre reprsent avec prcision par une rgion de lÕespace : la rgion sera plus ou moins grande dans une dimension donne suivant que le paramtre correspondant sera plus ou moins bien dtermin, et les sens intermdiaires trouveront leur place exacte dans le continuum de valeurs que peut prendre chaque paramtre. Cette reprsentation respecte les proximits de sens en les traduisant par des relations topologiques de voisinage et de recouvrement partiel entre les rgions correspondantes de lÕespace smantique.
Figure 1 : Exemple dÕespace smantique
![]() |
Figure 2 : Reprsentation dÕune ambigut alternative
Ainsi, si lÕon se rfre la figure 1, o lÕon a reprsent les deux premires dimensions de cet espace, on peut voir les rgions associes quelques unes des occurrences possibles de peinture. Comme on peut le constater, une peinture de Picasso, en lÕabsence de tout contexte plus prcis, occupe une rgion qui couvre toute la dimension Ôpoint de vue sur lÕentitÕ, puisque tous les aspects de lÕentit sont a priori pertinents, alors que une peinture expressive est localise plus prcisment sur cet axe, puisque seule lÕentit signifiante est voque par cette expression.
Bien entendu, la prise en compte de la troisime dimension conduirait mieux localiser ces rgions : ainsi un pot de peinture se situerait dans la partie Ôdomaine industrielÕ sur cette dimension alors que une peinture de Picasso occuperait la partie Ôdomaine artistiqueÕ.
Il faut noter que cette reprsentation permet de aussi traiter les ambiguts alternatives comme un cas de figure spcifique, diffrent des cas de plus ou moins grande indtermination. Prenons lÕexemple de la phrase : Pierre a achet une belle peinture. En dehors de tout contexte, il peut sÕagir dÕun matriau ou dÕun tableau. Dans ce cas, la rgion associe peinture sera constitue de deux sous-rgions spares (Į non connexes Č, en termes mathmatiques) dans lÕespace smantique, comme on peut le voir figure 2.
Ce type de reprsentation rend donc mieux compte de la complexit des phnomnes de polysmie. Associer chaque unit polysmique un espace smantique plutt quÕune liste de sens permet de dterminer avec prcision le sens de chaque acception du terme tudi sans pour autant carter la notion de proximit smantique qui joue un rle essentiel dans la dfinition mme de la polysmie. De plus les diffrents Į cas de figure Č interprtatifs (sens prcis, indtermination, ambigut alternative) correspondent de vritables cas de figure gomtriques dans lÕespace associ, et cÕest prcisment sur cette base que lÕon peut construire un modle dynamique de construction du sens. Dans le modle que nous avons conu (cf. Victorri et Fuchs 1996), les rgions correspondant au sens dÕune unit dans un nonc donn sont obtenues partir des bassins dÕattracteurs dÕune dynamique dpendant des lments contextuels prsents dans cet nonc. Ce modle mathmatique a t implment sur ordinateur lÕaide dÕun rseau connexionniste fonctionnant par apprentissage, et nous avons pu montrer sur un exemple (le mot encore) que lÕon pouvait ainsi calculer automatiquement le sens dÕune unit polysmique dans nÕimporte quel nonc qui la contient.
Mais lÕapplication de cette mthode dans le traitement automatique des langues pose un problme redoutable. En effet, il faut, pour chaque unit polysmique de la langue, construire dÕabord lÕespace smantique correspondant qui va tre Į cod Č dans le rseau connexionniste. Comme on lÕa vu avec lÕexemple de peinture, ce travail de construction de lÕespace ne prsente pas de difficult thorique particulire, mais il rclame une analyse linguistique spcifique pour chacune des units lexicales de la langue. Etant donn le nombre des mots polysmiques dÕune langue, il est irraliste dÕesprer pouvoir disposer dÕune reprsentation de chacun de ces mots en un temps raisonnable.
CÕest pourquoi nous avons cherch automatiser ce processus en utilisant une ressource lectronique : un dictionnaire lectronique de synonymes du franais[3]. Ce dictionnaire contient prs de 50 000 entres et 400 000 relations synonymiques. La base de dpart est constitue de sept dictionnaires classiques (Bailly, Benac, Du Chazaud, Guizot, Lafaye, Larousse et Robert) dont ont t extraites les relations synonymiques qui ont t ensuite regroupes et homognises. Les relations rpertories dans ces dictionnaires sont des relations de synonymie partielle : pour que deux units soient dites synonymes, il suffit quÕelles aient des sens trs proches dans certains de leurs emplois, mme si elles prennent des sens trs diffrents dans dÕautres contextes. Par exemple peinture et tableau, qui sont loin de partager tous leurs sens, sont considrs comme synonymes, parce quÕil existe des contextes o peinture peut tre remplac par tableau, et vice versa, sans changement notable de sens (cÕest vrai aussi bien pour une peinture de Picasso que pour la peinture des mĪurs).
Ainsi chaque synonyme ne couvre quÕune partie des emplois dÕun mot donn et ne reprsente donc quÕune partie de lÕespace smantique que lÕon cherche construire. En revanche, si lÕon considre lÕensemble des synonymes du mot, on doit obtenir un recouvrement de lÕespace smantique. Qui plus est, cet ensemble de synonymes est structur, puisque lÕon sait, pour chaque couple de synonymes du mot tudi, si ces deux units sont elles-mmes synonymes entre elles ou non. En termes mathmatiques, on dispose de la structure du graphe constitu par la relation de synonymie. En particulier, on peut obtenir ce que lÕon appelle les Į cliques Č du graphe, cÕest--dire les sous-ensembles[4] de synonymes du mot qui sont tous synonymes entre eux deux deux. Ce sont ces cliques qui vont nous permettre de construire lÕespace smantique.
Pour tre concret, reprenons lÕexemple de peinture. Le dictionnaire nous donne 52 synonymes, tels que couleur, barbouillage, fresque, crote, toile, portrait, tableau, description, reprsentation, etc., qui couvrent assez bien tous les sens de peinture. Parmi eux, certains sont synonymes entre eux, comme toile et tableau, description et tableau, reprsentation et tableau, reprsentation et description, et dÕautres ne le sont pas, comme toile et description, par exemple. Parmi les cliques du graphe, on aura donc au moins les deux cliques suivantes :
- peinture, tableau, toile.
- peinture, tableau, reprsentation, description[5].
Comme on peut le constater, ces deux cliques caractrisent deux sens prcis de peinture : la premire, le sens concret dÕĪuvre dÕart picturale (une peinture de Picasso), et la deuxime, le sens plus abstrait de description non picturale (la peinture des mĪurs). Si lÕon calcule toutes les cliques du graphe de peinture, on obtient 49 cliques maximales, qui caractrisent chacune un sens prcis de peinture. En voici quelques exemples supplmentaires :
- peinture, enduit, revtement.
- peinture, badigeonnage, barbouillage.- peinture, barbouillage, crote.- peinture, couleur, gouache.- peinture, couleur, fard.- peinture, aquarelle, gouache, image.etc.
Les cliques peuvent donc tre considres comme de toutes petites rgions, que lÕon peut assimiler des points, de lÕespace smantique que lÕon cherche construire, puisquÕelles dfinissent des sens trs troits de lÕunit polysmique tudi. En revanche, les synonymes occupent des rgions beaucoup plus larges, puisquÕun mme synonyme peut participer de nombreuses cliques. En dÕautres termes, la donne dÕun seul synonyme ne suffit pas prciser suffisamment le sens (que lÕon pense tableau, par exemple), alors que la donne dÕune clique le permet.
Partant de ce constat, nous avons conu un algorithme de construction de lÕespace smantique en dfinissant une distance entre cliques, considres donc comme des points de lÕespace construire[6]. Cet espace comporte un grand nombre de dimensions, mais on peut obtenir, par des algorithmes classiques de dcomposition en composantes principales, des visualisations assez fidles sur un nombre rduit de dimensions. Nous avons ralis un logiciel, Visusyn, qui permet dÕeffectuer lÕensemble de ces oprations. Ainsi, pour peinture, on peut voir figure 3 une projection bidimensionnelle de lÕespace obtenu par Visusyn.
Comme on peut le constater, les cliques, reprsentes par des points, sÕorganisent suivant une certaine structure topologique : des points proches correspondent des cliques de sens voisins. En premire approximation, on peut estimer que ces points se situent le long dÕune courbe, et que, si lÕon parcourt cette courbe dÕune extrmit lÕautre, on passe successivement par les sens ÔmatriauÕ, ÔactivitÕ, ÔĪuvre dÕartÕ et ÔdescriptionÕ.
Sur la figure 4, on a reprsent les rgions correspondant trois synonymes de peinture, choisis titre dÕexemple : barbouillage, portrait et tableau. Comme on pouvait sÕy attendre, ces synonymes occupent des rgions plus ou moins vastes de lÕespace smantique, suivant le degr de prcision avec lequel ils spcifient le sens de peinture. On a aussi reprsent deux sens largement sous-dtermins de peinture : une peinture chre (qui peut sÕappliquer aussi bien au matriau quÕ une Īuvre dÕart) et une peinture expressive (qui peut sÕappliquer une Īuvre dÕart ou une description non picturale).
Il faut noter que cette reprsentation est particulirement conomique : puisque lÕon peut, en premire approximation, considrer que lÕespace smantique se rduit une courbe (varit une dimension), cela veut dire que lÕon peut reprsenter les principales variations de sens de peinture par un seul paramtre (lÕabscisse curviligne sur cette courbe). Si lÕon compare le rsultat obtenu lÕanalyse linguistique prsente la section prcdente, on remarque que la reprsentation automatique, tout en tant plus frustre, prserve une partie essentielle des distinctions que nous avions mises jour. Cette reprsentation trs simplifie peut donc tre suffisante pour de nombreuses applications en traitement automatique. De plus, si lÕon a besoin de plus de finesse, rien dÕempche dÕutiliser plus de dimensions, puisque, ne lÕoublions pas, la reprsentation bidimensionnelle de la figure 3 nÕest quÕune projection de lÕespace smantique multidimensionnel construit par le systme.
Ainsi, on dispose dÕune mthode informatique pour construire un espace smantique associ nÕimporte quelle unit polysmique de la langue. Mme si les reprsentations ne sont pas parfaites, cette mthode, parce quÕelle est entirement automatique, permet de concevoir des applications informatiques qui seraient inenvisageables sans cela. Cet outil peut aussi fournir une aide prcieuse aux lexicographes et aux spcialistes de smantique lexicale. En effet, comme nous allons le voir, lÕexamen de la structure de lÕespace smantique obtenu peut contribuer de manire significative la comprhension de la polysmie dÕun mot.
Figure 3 : Reprsentation des cliques de peinture
Figure 4 : Reprsentation de quelques synonymes et sens de peinture
Pour illustrer lÕintrt de Visusyn pour lÕanalyse linguistique, nous avons choisi lÕexemple du verbe jouer. Ce verbe est fortement polysmique, comme le montre les quelques exemples suivants :
Pierre joue aux checs.
Marie joue Andromaque.
Marie joue du piano.
Marie joue des coudes.
Pierre joue les innocents.
Pierre nous a jou un sale tour.
La porte joue sur ses gonds.
La barque joue sur son ancre.
etc.
Pourtant, au del de cette diversit de sens, il semble bien que ce verbe prsente une certaine unit smantique, mme si celle-ci nÕest pas facile dfinir. Comme le dit Pierre Cadiot dans la conclusion dÕun article quÕil a consacr ce verbe (Cadiot 1998) :
Į Cette diversit de sens couple des proprits formelles partiellement diffrenciantes pousse naturellement vers une vision dgroupante ou homonymique. Aprs tout, il peut paratre fort peu naturel de chercher maintenir un sens commun se jouer des obstacles et jouer les incompris, jouer la marelle et jouer de malchance, jouer un cheval et jouer sur les nerfs de quelquÕun, etc. Les dgroupements des autres langues parlent aussi contre cette volont de trouver tout prix un sens commun. Pourtant, cÕest bien notre intuition de locuteurs natifs qui nous pousse dans la voie inverse : celle dÕun sens de base unique. Au del de lÕintuition, nous avons montr ici que la diversit des effets de sens tait en corrlation avec des contraintes ou conditions externes systmatiques. [É]. Il reste trouver un noyau stable de sens, une sorte dÕinstruction ou de schma de base. Č
Pierre Cadiot propose ensuite quelques pistes pour dfinir ce schma de base. Nous les discuterons plus bas, mais auparavant, nous allons examiner les rsultats fournis par Visusyn, pour montrer comment cet outil peut aider analyser la structure polysmique dÕune unit lexicale.
Le verbe jouer possde 94 synonymes dans notre dictionnaire lectronique, et ces synonymes forment 98 cliques, ce qui correspond bien au haut degr de polysmie de ce verbe. On trouvera figure 5 la projection bidimensionnelle de lÕespace smantique construit par Visusyn. LÕexamen de la figure[7] permet de faire plusieurs observations intressantes :
- On remarque dÕabord quÕil nÕy a pas de Į dgroupement Č notable des sens : on passe dÕun sens lÕautre de manire continue, ce qui milite en faveur dÕune unit smantique de jouer, comme le propose Pierre Cadiot.
- Les diverses significations de jouer sÕorganisent selon deux axes (cf. figure 6). LÕaxe vertical fait passer progressivement de valeurs o jouer dsigne une activit que lÕon exerce aux dpens dÕautrui (berner, duper, mystifier) des valeurs o, au contraire, lÕactivit sÕexerce ses propres dpens (hasarder, risquer, miser). Sur lÕaxe horizontal, on passe de valeurs o lÕactivit est centre sur le sujet (se divertir, rire, foltrer) des valeurs opposes o lÕactivit consiste se projeter sur autrui (copier, imiter, simuler).
- Au centre de lÕespace smantique, on trouve des valeurs Į neutres Č pour les dimensions subjectives portes par les deux axes. CÕest notamment dans cette zone que lÕon trouve les sens de jouer dans lesquels il dsigne une activit non intentionnelle (La porte joue sur ses gonds, La barque joue sur son ancre, etc.).
Cette dernire remarque peut nous permettre de dcouvrir ce qui fait lÕunit du smantisme de jouer. En effet, on peut faire lÕhypothse que ces valeurs neutres reprsentent un sens de base dont les traits essentiels seraient partags par tous les sens du verbe. LÕtude de ce sens de base peut donc se rvler trs prcieuse pour lÕanalyse smantique du verbe.
Or dans ce type dÕemplois, jouer dsigne une activit qui sÕexerce selon des degrs de libert Į non standards Č, non prvus par le dispositif en question. Une porte est faite pour tourner autour dÕun axe. Quand elle joue sur ses gonds, cela signifie quÕ ce mouvement de rotation Į normal Č se superpose un mouvement non prvu de translation verticale qui reprsente une libert supplmentaire pour le mcanisme.
Il est clair que cette caractristique est prsente dans tous les sens du verbe jouer. Dans tous les cas, jouer dsigne une activit qui sÕoppose une activit rgulire, programme, en ouvrant des degrs de libert sur lesquels cette nouvelle activit peut sÕexercer. Cela ne veut pas dire que cette nouvelle activit ne soit pas elle-mme rgule (que lÕon joue aux checs, au football, au thtre, ou encore aux courses). Mais les rgles de cette activit de jeu, quand elles existent, sÕinscrivent dans un espace de libert qui nÕa plus rien voir avec le fonctionnement de lÕactivit normale laquelle elle sÕoppose.
Il est remarquable que la dfinition que nous venons de donner pour jouer rejoigne pour lÕessentiel les rflexions de Pierre Cadiot dans lÕarticle que nous avons cit. En effet, au terme de son analyse, il propose de construire le schma de base associ jouer autour de deux notions de Į ddoublement Č et de Į marge Č :
Į Le ddoublement semble une condition de base. Il faut que le jeu sÕoppose une activit prsente comme plus normale et rgulire. [É]. Une marge qui est une rupture dans la contrainte dÕune programmation ou dÕune attente, prouve surtout Đmais pas seulement- dans sa dimension temporelle Č.
Ainsi, cet exemple montre que les reprsentations obtenues par Visusyn sont pertinentes pour lÕanalyse smantique de la polysmie. Bien entendu, ce nÕest quÕun outil qui ne saurait se substituer au travail du linguiste. En particulier, il ne prend pas en compte le niveau syntaxique, dont lÕimportance est primordiale pour tudier le dploiement des sens dÕune unit polysmique, comme le montre Pierre Cadiot dans son article. Mais cÕest un outil puissant, qui fait clairement ressortir la structure smantique dÕune unit lexicale partir des relations paradigmatiques que lÕunit tudie entretient avec les mots de sens voisins. A ce titre, il constitue une aide trs prcieuse pour les smanticiens et les lexicographes.
Figure 5 : Espace smantique associ jouer
|
Figure 6 : Structure de lÕespace smantique associ jouer
![]() |
Comme on lÕa vu, Visusyn permet dÕobtenir des reprsentations des units lexicales qui peuvent tre exploites aussi bien par les concepteurs de systmes de traitement automatique du calcul du sens que par les linguistes spcialistes de la polysmie. Outre son intrt pour les applications informatiques et la recherche linguistique, ce logiciel permet aussi aux simples usagers et amoureux de la langue de visualiser dÕun seul coup dÕĪil le dploiement des sens dÕun mot donn, et de saisir les principes qui rgissent ce dploiement.
LÕune des applications sans doute les plus prometteuses de ces techniques concerne le domaine de la traduction. En effet, on peut tendre la relation de synonymie interne une langue une relation entre langues, deux mots de langue diffrente tant considrs comme synonymes sÕils sont des traductions possibles lÕun de lÕautre. Si lÕon dispose de dictionnaires de synonymes pour chacune des langues, ainsi que des dictionnaires bilingues correspondants, on peut donc, en utilisant les mmes algorithmes, construire un espace smantique pour un mot dans lequel ses traductions dans une langue cible occuperont des rgions de lÕespace. On obtient donc en outil dÕaide la traduction, qui prsente visuellement une cartographie des sens dÕun mot dans la langue source auxquels sont associes les traductions pertinentes dans la langue cible. Sabine Ploux a ainsi constitu ce quÕelle appelle des Į atlas smantiques Č pour le franais et lÕanglais[8].
Ces travaux montrent tout lÕintrt de lÕutilisation des nouvelles technologies dans le domaine de lÕtude de la langue. Ce champ de recherche pluridisciplinaire, qui mobilise des mathmaticiens, des informaticiens et des linguistes, est aujourdÕhui en pleine expansion. En produisant de nouveaux outils dÕapprhension et de matrise des phnomnes linguistiques, ces recherches vont sans aucun doute contribuer transformer substantiellement notre relation la langue et au texte.
Cadiot P. (1998) : Les sens de jouer : esquisse d'une approche par le biais des attaches prpositionnelles, Prpositions et rection verbale, Presse Universitaire de Reims, 11:105-129.
Chomsky N. (1995) : Language and Nature,. Mind, 104 :1-61.
Habert B., Nazarenko A. et Salem A. (1997) : Les linguistiques de corpus. Paris, Armand Colin.
Habert B., Fabre C. et Issac F. (1998) : De l'crit au numrique : constituer, normaliser, exploiter les corpus lectroniques. Paris, Interditions.
Kleiber G. (1999) : Problmes de smantique Đ La polysmie en questions, Villeneuve dÕAscq, Septentrion.
Milner J.-C. (1989) : Introduction une science du langage, Paris, Seuil.
Ploux S., Victorri B. (1998) : Construction dÕespaces smantiques lÕaide de dictionnaires de synonymes, Traitement automatique des langues, 39/1 :161-182.
Victorri B. (sous presse) : Langage et cognition : le malentendu cognitiviste, Des lois de la pense au constructivisme, M.J. Durand Richard d., Paris, Maison des Sciences de lÕHomme.
Victorri B., Fuchs C. (1996) : La polysmie Đ Construction dynamique du sens, Paris, Herms.
[1] Pour une discussion des diffrentes approches thoriques contemporaines en smantique lexicale, voir Kleiber 1999.
[2] On pourrait juger que ces trois valeurs sont en fait gale distance les une des autres. Dans ce cas, on choisira une reprsentation circulaire pour cette dimension. Nous nÕentrerons pas ici dans les dtails, mais cela ne pose aucun problme si lÕon dfinit mathmatiquement lÕespace smantique comme une varit diffrentiable (cf. Victorri et Fuchs 1996).
[3] Ce dictionnaire a t ralis par Sabine Ploux au laboratoire de linguistique de lÕUniversit de Caen. Il existe aujourdÕhui deux versions de ce dictionnaire consultables sur le Web aux adresses suivantes :
- http://elsap1.unicaen.fr/dicosyn.html : site conu et gr par Jean-Luc Manguin lÕUniversit de Caen ;
- http://dico.isc.cnrs.fr/ : site conu et gr par Sabine Ploux lÕInstitut des Sciences Cognitives de Lyon.
[4] Plus prcisment, ce sont les sous-ensembles maximaux de tels synonymes qui nous intressent (les sous-graphes complets maximaux, en termes mathmatiques).
[5] Nous avons quelque peu simplifi cet exemple pour ne pas alourdir la prsentation. La clique maximale correspondante est en fait constitue de peinture, tableau, reprsentation, description, fresque, image, portrait.
[6] On trouvera tous les dtails de cet algorithme dans Ploux et Victorri 1998.
Signalons aussi que lÕon peut consulter la liste des cliques dÕun mot quelconque ainsi quÕune visualisation de lÕespace smantique correspondant sur les deux sites Web rfrencs ci-dessus (note 3).
[7] Dans la figure 5, on nÕa pas fait figurer le verbe jouer dans les tiquettes associes aux cliques, uniquement pour des raisons de lisibilit du graphique, mais bien sr jouer appartient chacune des cliques reprsentes.
[8] Ces outils sont consultables sur le Web lÕadresse dj cite : http://dico.isc.cnrs.fr/.