You are on page 1of 45

F RANOIS

D UPRESSOIR
NSL
2005-2006

LIRMM
UMR 5506
161, rue Ada
34394 Montpellier Cedex 5

R APPORT DE S TAGE
Exploitation de la construction syntaxique des verbes pour lvaluation
automatique de linfluence smantique de leurs complments.

Matres de stage : Mehdi Y OUSFI -M ONOD & Augusta M ELA


Enseignants tuteurs : ric T HIERRY & Eddy C ARON

LIRMM
UMR 5506
161, rue Ada
34394 Montpellier Cedex 5

F RANOIS
D UPRESSOIR
NSL
2005-2006

'

R SUM :
Une tche importante dans le cadre dun travail de contraction
de phrase, ou de rsum automatique en gnral, est le reprage
des lments syntaxiques obligatoires, mais aussi des lments
smantiques importants.
Aprs une courte prsentation du laboratoire, de lquipe, et des
logiciels utiliss par celle-ci, je prsenterai dans un premier temps
les concepts grammaticaux et linguistiques utiles la comprhension et la rsolution du problme, puis la solution envisage pour le rsoudre, en commenant par la constitution dune
ressource lexicale complte et en terminant par une utilisation
possible dune telle ressource dans le cadre du laboratoire par la
constitution dune grammaire.

&

'

M OTS - CLEFS :
contraction de phrases, traitement automatique des langues,
langues naturelles, circonstants, sous-catgorisation, grammaires
dunification

&

Remerciements
Merci Mehdi Y OUSFI -M ONOD, Violaine P RINCE et Jacques C HAUCH pour leur
soutien en ce qui concerne lutilisation de SYGMART et SYGFRAN et pour la patience
et la comprhension dont ils ont fait preuve lorsque je me suis retrouv face aux problmes lis la complexit de la langue. Un grand merci Augusta M ELA pour ses
lumires et ses rfrences autant en grammaire quen linguistique, et en particulier en
TALN.
Merci Caroline D AVID, qui ma confirm, si besoin tait, que la linguistique tait
une discipline formidable mais "un peu complique".
Merci Virginie Q UESNAY pour la classe rapportiup, utilise pour mettre en
forme ce rapport.
Merci Judicalle pour le reste, et pour a aussi.

Ce rapport, produit avec LATEX 2 , a t compil le 30 aot 2006.

Franois D UPRESSOIR - NSL - 31 aot 2006

Remerciements

Franois D UPRESSOIR - NSL - 31 aot 2006

ii

Table des matires


Remerciements

Liste des illustrations

Prsentation
1
Prsentation du LIRMM . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Prsentation Gnrale . . . . . . . . . . . . . . . . . . . . .
1.2
Le dpartement Informatique . . . . . . . . . . . . . . . . .
2
Prsentation de lquipe de Traitement Automatique des Langues
1

Contexte Scientifique
1.1 Analyse morpho-syntaxique . . . .
1.1.1 Le systme SYGMART . . . .
1.1.2 Les rgles SYGFRAN . . . .
1.1.3 Rsultats . . . . . . . . . . .
1.2 Rsum automatique . . . . . . . .
1.2.1 Lextraction de phrases . . .
1.2.2 Lextraction de constituants
1.3 Contraction de phrase . . . . . . .
1.3.1 Prsentation du systme . .
1.3.2 Rsultats . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

1
1
1
1
2

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

5
. 5
. 5
. 6
. 6
. 8
. 8
. 8
. 9
. 9
. 10

Problmatique

11

Considrations Grammaticales
2.1 Grammaires traditionnelles . . . . . .
2.2 Grammaires dunification . . . . . . .
2.2.1 Lexical functional grammar (LFG)
2.2.2 Le Lexique-Grammaire . . . .

.
.
.
.

.
.
.
.

.
.
.
.

13
13
14
14
15

Marquage des complments


3.1 Principes et choix thoriques . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Choix dune approche particulire . . . . . . . . . . . . . . . .
3.1.2 Constitution du lexique . . . . . . . . . . . . . . . . . . . . . .
3.2 Ralisation du marquage . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Pr-traitement : Mise en forme de lanalyse SYGFRAN . . . . .
Formes rflchies . . . . . . . . . . . . . . . . . . . . . . . . . .
Formes impersonnelles . . . . . . . . . . . . . . . . . . . . . .
Voix passive . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Reprage des complments potentiels . . . . . . . . . . . . . .
3.2.3 Traitement : lecture du lexique et marquage des complments

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

19
19
19
19
22
23
23
23
24
25
25

Franois D UPRESSOIR - NSL - 31 aot 2006

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

iii

TABLE DES MATIRES

3.3

Dtection des formes supports . . . . . . . . . . . . . . . . . . . . 26


Marquage effectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Rsultats et dveloppements futurs . . . . . . . . . . . . . . . . . . . . . . 27

Conclusion

29

Annexes

31

A Extrait dun conte polynsien


33
A.1 Texte Initial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.2 Rsultat de la compression . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Bibliographie

37

Franois D UPRESSOIR - NSL - 31 aot 2006

iv

Liste des illustrations


1.1
1.2
1.3

SYGFRAN fonctionne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analyse SYGFRAN partielle . . . . . . . . . . . . . . . . . . . . . . . . . . .
Analyse dune phrase ambigu . . . . . . . . . . . . . . . . . . . . . . . .

2.1
2.2
2.3

Structures c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Structures f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Exemple dunification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.1
3.2
3.3

Extrait du lexique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Rgle : propagation des formes impersonnelles infinitives . . . . . . . . . 24
Rgle : traitement des verbes supports . . . . . . . . . . . . . . . . . . . . 26

Franois D UPRESSOIR - NSL - 31 aot 2006

6
7
7

LISTE DES ILLUSTRATIONS

Franois D UPRESSOIR - NSL - 31 aot 2006

vi

Prsentation
1
1.1

Prsentation du LIRMM
Prsentation Gnrale

Le Laboratoire dInformatique, de Robotique et de Microlectronique de Montpellier - LIRMM - est une unit mixte de recherche, dpendant conjointement de lUniversit Montpellier II et du Centre National de la Recherche Scientifique. Les recherches
actuelles et en mergence au LIRMM couvrent un large spectre de linformatique et
de ses applications :
linformatique fondamentale,
linteraction entre les systmes informatiques et les utilisateurs,
le dveloppement de machines communicantes dintervention, de production
ou de service,
le dveloppement des composants matriels et logiciels des systmes informatiques et de communication.
Treize ans aprs sa cration en 1992, les interactions entre chercheurs de cultures initiales diffrentes ont conduit de nouveaux thmes de recherche dans lesquels les
aspects logiciels et matriels sont abords conjointement. Les recherches du LIRMM
trouvent gnralement une finalisation dans des domaines applicatifs aussi divers que
la biologie, la chimie, les tlcommunications, le secteur mdical, la documentation...et
dans les domaines propres du laboratoire : linformatique, llectronique et lautomatique. Le laboratoire regroupe 292 personnes (dont 152 permanents) :
95 enseignants-chercheurs et 29 chercheurs CNRS (et galement INRIA,...)
28 ingnieurs, techniciens ou administratifs (+6 contractuels)
134 doctorants
3 chercheurs contractuels (hors doctorants).
Le LIRMM pilote deux formations doctorales, lune en Informatique, lautre en Systmes automatiques et microlectroniques. En moyenne, la production scientifique
annuelle du LIRMM est de 350 publications, dont 25 thses de doctorat et 170 publications dans des revues ou des congrs daudience internationale. Aux soutiens
du CNRS et de lUniversit Montpellier II, sajoutent ceux dune quinzaine de programmes de recherche nationaux et dune dizaine de programmes de recherche europens auxquels le LIRMM participe.

1.2

Le dpartement Informatique

Le Dpartement dInformatique du LIRMM regroupe actuellement 76 chercheurs


permanents, 13 chercheurs associs et plus de 70 doctorants, et quelques ingnieurs
contractuels supportent les quipes dans le cadre de contrats europens ou industriels,
ou dactions nationales. Les thmatiques du dpartement couvrent lessentiel de la
recherche actuelle en informatique et ses applications :

Franois D UPRESSOIR - NSL - 31 aot 2006

Prsentation

Algorithmique :
bioinformatique, cryptographie, graphes, rseaux,
Bases de Donnes et Systmes dInformation :
intgration de donnes, fouille de donnes, maintien de la cohrence,
Gnie Logiciel :
langages de programmation, objets, composants, modles,
Intelligence Artificielle :
apprentissage, contraintes, reprsentation des connaissances, systmes multiagents,
Interaction Homme-Machine :
hypermedia, langage naturel, visualisation, web smantique et e-learning.

Prsentation de lquipe de Traitement Automatique des Langues

Cest dans ce contexte trs riche que travaille lquipe TAL, dont lobjectif est de
concevoir et de raliser un artefact qui soit en mesure daccepter des productions langagires, et de les interprter en vue de la ralisation de tches prcises : traduction,
recherche dinformation, classification de documents, dialogues, commandes de robots,etc. Lquipe se compose de :
Jacques C HAUCH (chercheur)
Mathieu L AFOURCADE (chercheur)
Violaine P RINCE (chercheuse)
Mathieu R OCHE (chercheur)
Anne P RELLER (chercheuse)
Alain J OUBERT (chercheur)
Sylvain D EGEILH (doctorant)
Mehdi Y OUSFI -M ONOD (doctorant)
Alexandre L ABADI (doctorant)
Lquipe travaille essentiellement sur le Franais, mais avec des incursions dans dautres
langues (Anglais, Allemand), essentiellement dans le cadre de la traduction automatique. Le thme de recherche peut se dcomposer en trois axes principaux :
La Syntaxe
qui se dfinit travers deux impratifs :
Apprhension : dfinir le passage dune structure S1 dans un modle M1 vers
une structure S2 dun modle M2. Par exemple, le passage dune production
en langue naturelle vers une expression logique.
Comprhension : dfinir, partir de toutes les structures dun modle M1,
les structures correspondantes qui doivent tre obtenues par apprhension. Il
sagit dune application.
La Traduction ou Transformation, qui dfinit le passage dune structure S1 dans
un modle M vers une structure S2 du mme modle M. Par exemple, la transformation dune structure syntaxique arborescente dune phrase dans une langue
L1 vers une structure syntaxique arborescente dans une langue L2.
La Smantique ou Corrlation : Les structures dun modle M1 sont plonges
dans un modle M2 tel que lon puisse dfinir des normes et des distances. Des
calculs de "proximit" de structures permettent de traduire les relations smantiques de la linguistique.

Franois D UPRESSOIR - NSL - 31 aot 2006

Prsentation

Les recherches sur ces trois axes donnent lieu diverses applications :
recherche dinformations laide du langage naturel (C HAUCH , L AFOURCADE ,
P RINCE , R OCHE , L ABADI)
classification de documents par lanalyse de contenu (C HAUCH , P RINCE , R OCHE)
segmentation thmatique de textes (C HAUCH , P RINCE , R OCHE , L ABADI)
cration et amlioration de ressources lexicales (L AFOURCADE , P RINCE)
amlioration de ressources multilingues (L AFOURCADE)
traduction automatique fonde sur lanalyse (C HAUCH , P RINCE)
vrification grammaticale (P RELLER , P RINCE , D EGEILH)
contraction automatique de textes (P RINCE , Y OUSFI -M ONOD)
Cest plus particulirement sur cette dernire application que jai travaill, sous la direction de Mehdi Y OUSFI -M ONOD et Augusta M ELA, chercheuse associe lquipe.
Mais avant de prsenter mon travail, voici tout dabord une prsentation plus prcise
du contexte scientifique dans lequel sinscrit le travail effectu lors du stage.

Franois D UPRESSOIR - NSL - 31 aot 2006

Prsentation

Franois D UPRESSOIR - NSL - 31 aot 2006

Chapitre 1

Contexte Scientifique
1.1

Analyse morpho-syntaxique

Lanalyse morpho-syntaxique consiste donner sur les lments dun texte des
informations morphologiques (temps, genre, nombre...) et syntaxiques (nature, fonction...). Cette analyse est la base de toute application en traitement automatique des
langues, naturelles ou non. Il existe plusieurs moyens de leffectuer, mais je nentrerai
pas dans les dtails, mon travail ne porte pas sur cette partie du traitement, mais un
lien troit existe entre lanalyse syntaxique et lanalyse smantique. Je prsenterai donc
sommairement le systme SYGMART, ainsi que lensemble de rgles SYGFRAN utiliss
au cours du stage sans passer en revue les diffrentes approches existantes pour lanalyse.

1.1.1

Le systme SYGMART

SYGMART ,

introduit pour la premire fois par Jacques C HAUCH ([Cha84]), est un


systme de transformation dlments structurs qui peut servir diverses oprations
sur les chanes de caractres, entre autres leur analyse syntaxique. Il se prsente sous
la forme de trois sous-systmes :
OPALE ralise le passage entre les chanes de caractres et les lments structurs
manipuls par le systme ;
TELESI ralise les manipulations dlments structurs ;
AGATE ralise le passage dun lment structur au format de sortie souhait
pour le systme (chane de caractre, fichier texte, fichier XML...)
Les "lments structurs" manipuls par SYGMART sont des arbres multi-tiquets.
Pour effectuer les transformations, SYGMART utilise, aprs les avoir compils, un ensemble de rgles de grammaire et des dictionnaires, fournis par lutilisateur, et crits
dans le langage spcifique au sous-systme qui les utilisera. Ces langages sont dcrits
dans le manuel de rfrence ([Cha01]), qui explique aussi plus finement le fonctionnement mme des transformations, sans pour autant spcifier leur implmentation,
dont il est plus particulirement question dans [Cha84].
Une telle architecture en couches a plusieurs avantages, dabord en permettant lutilisateur deffectuer toutes les oprations quil souhaite effectuer avant la sortie finale
en faisant simplement appel TELESI autant de fois que ncessaires avec les grammaires de son choix, mais aussi en permettant de modifier ou dajouter une grammaire
(et donc le traitement qui lui correspond) sans modifier les autres.

Franois D UPRESSOIR - NSL - 31 aot 2006

Contexte Scientifique

PH
qMVMVMVMVVV
q
q
MMMVVVVVV
q
q
V
qq
GN

GV

SYGFRAN

fonctionne

F IG . 1.1 Un exemple danalyse SYGFRAN russie.

1.1.2

Les rgles SYGFRAN

Pour effectuer lanalyse morpho-syntaxique dun texte crit en franais, Jacques


C HAUCH, a crit et met rgulirement jour un ensemble de grammaires et de dictionnaires pour SYGMART : SYGFRAN. Ces rgles et ces lexiques sont complts au fil
des expriences sur diffrents corpus et en fonction des demandes des utilisateurs, si
bien que SYGFRAN compte actuellement plus de 12000 rgles de grammaire et prsente
des rsultats bien suprieurs1 dautres systmes danalyse, mme sil est souvent difficile de comparer des rsultats dans un domaine aussi ambigu et aussi peu formalis
que la grammaire dune langue naturelle. Le principal inconvnient dune telle mthode de construction de la ressource lexicale est quelle consiste en une juxtaposition
de cas particuliers. Comme nous le verrons, intgrer des rgles gnrales utilisant les
rcentes avances en matire de grammaire et de linguistique dans un tel cadre est
difficile. Cependant, il faut garder lesprt que SYGMART ntait, lorigine quun systme exprimental visant dmontrer lefficacit de lapproche choisie pour lanalyse
et quil a, ce titre, fait ses preuves.

1.1.3

Rsultats

SYGFRAN

peut renvoyer les rsultats sous diverses formes suivant la grammaire

AGATE choisie. Voici une prsentation succinte de quelques possibilits de SYGFRAN sous

forme darbre syntaxique. Les tiquettes reprsentes ici sont incompltes et les lments rellement manipuls par les systme portent bien plus dinformations, au
cours du traitement comme dans le rsultat final.
Lorsque SYGFRAN fonctionne, il renvoie le rsultat sous la forme choisie2 . La figure
1.1 montre un exemple (trs) simple danalyse russie.
En cas dchec de lanalyse, SYGFRAN renvoie une analyse partielle (figure 1.2) qui
peut tre utilise dans une application.
Enfin, lorsquil nest pas possible de lever totalement les ambiguts de lanalyse, SYG FRAN ddouble larbre (figure 1.3) pour rendre compte des diffrentes interprtatons
possibles de la phrase, laissant lutilisateur faire le choix, soit de manire manuelle, soit
en crivant des rgles tenant compte du contexte, du thme gnral, du type de texte
ou dautres facteurs permettant une dsambiguisation.
Ces deux dernires caractristiques de SYGFRAN (figures 1.2 et 1.3) font de lui un
1

Les rsultats de la campagne dvaluation EASY des analyseurs du franais sont significatifs, SYG donnant des rponses justes 70% pour les analyses en constituants contre 30% en moyenne pour
les autres valuateurs.
2
Suivant la grammaire AGATE slectionne.
FRAN

Franois D UPRESSOIR - NSL - 31 aot 2006

Contexte Scientifique

ULFRA
cehcehcehqcehqcehqVYVYVYVYVYVYVYYYY
c
c
c
e
c
e
c
e
c
h
e
c
VVVVYYYYYY
ccccceeee hh q
YYY
VV
ccccccceceeeee hhhhh qqq
GN PH GADV ULOCC ULOCC

PH

qMM
qqq MMMMM
q
q
q

Il

GV aussi vite

que

court

GN

GV

il

peut

F IG . 1.2 Un exemple danalyse partielle : Il court aussi vite quil peut.

PHAMB

Y
eeeeee YYYYYYYYYYY
YYYYYY
eeeeee
e
e
e
e
e
Y
ee

PH
M
hhhh MMMM
h
h
h
h
h
MM
h
hhh

PH
M
hhhh MMMM
h
h
h
h
h
MM
h
hhh
GN
qqMMMMM
q
q
MM
q
qq
la

GV
M

GN
qqMMMMM
q
q
MM
q
qq

MMM
MMM

petite brise COD


M

qM
qqq MMMMM
q
q
q

la

glace

la

GV
M

MMM
MMM

petite brise COD glace


la

F IG . 1.3 Un exemple danalyse ambigu : La petite brise la glace.

Franois D UPRESSOIR - NSL - 31 aot 2006

Contexte Scientifique

analyseur syntaxique robuste, qui peut servir des applications alors mme que lanalyse quil fait de la phrase nest pas complte ou reste ambigu.
Cest donc sur ce systme robuste et performant que sont effectus la plupart des
travaux de lquipe TAL du LIRMM, et en particulier le travail de rsum automatique. Je vais tout dabord prsenter le travail de rsum de manire plus gnrale
avant de prsenter plus particulirement lapproche choisie dans lquipe.

1.2

Rsum automatique

Parmi toutes les tches du traitement automatique des langues, le rsum automatique est lune des plus compliques. En effet, elle fait intervenir des considrations
aussi bien syntaxiques et lexicales que smantiques et, par sa nature de rduction dinformation, pose de gros problmes conceptuels quant la mesure de "limportance"
dun lment ou de sa ncessit. De plus, ses applications en font un noeud important
parmi les nombreux problmes lis au TAL.
Plusieurs approches sont envisages pour rsumer un texte de manire automatique.
Toutes possdent leurs avantages et leurs inconvnients, et la meilleure des solutions
serait sans aucun doute de les appliquer toutes ou presque un texte pour obtenir
une bonne contraction. Voici une description de ces approches, passes en revue dans
[YMP06].

1.2.1

Lextraction de phrases

Ici encore, il sagit dextraire des lments saillants du texte, mais ce sont des
phrases compltes qui sont extraites, et non des syntagmes. Elles sont ensuite regroupes en un texte rsum de type extract. Lanalyse smantique na pas ici besoin dtre
particulirement prcise et fine et le risque de perte dinformation majeure3 est rduit. Cependant, il se peut quune phrase extrmement longue contenant un lment
saillant parmi de nombreux lments "inutiles" soit conserve dans le texte contract.
Par exemple, lextraction de phrase applique au court texte (1), dans un contexte o
llment saillant serait lautoroute conserverait la premire phrase en ngligeant la
seconde.
1. La longue file ininterrompue de voitures se tortillait lentement le long de lautoroute
surcharge. Personne navanait.

1.2.2

Lextraction de constituants

La phrase rsum
Cette mthode consiste extraire dun texte les lments smantiques saillants et
les regrouper et structurer en une phrase qui, on lespre sera reprsentative du
texte. Une analyse smantique fine du texte est donc ncessaire, ainsi quun moyen
de synthtiser la phrase rsum. Aucune perte majeure dinformation nest exclure.
Cependant, le taux de contraction est, bien entendu, trs lev.
3

En un sens qui reste dfinir.

Franois D UPRESSOIR - NSL - 31 aot 2006

Contexte Scientifique

La contraction de phrase
Cette mthode, sur laquelle jai travaill pendant un mois et demi, permet de
travailler, comme la prcdente, au niveau du syntagme, mais en le plaant dans la
phrase au lieu de le considrer comme un lment du texte. Le principe de cette approche est de supprimer, dans chaque phrase du texte, les lments qui ne sont pas
syntaxiquement ncessaires (i.e. les complments circonstanciels). Ainsi, le travail est
principalement syntaxique et ne ncessite que des informations que la plupart des
analyseurs syntaxiques fournissent. De plus, les considrations smantiques qui y apparaissent sont minimales et servent uniquement lever des ambiguts. tudions
plus en profondeur cette approche du rsum, et en particulier la manire dont elle a
t dveloppe laide de SYGMART ([YMP05]).

1.3

Contraction de phrase

1.3.1

Prsentation du systme

Tout dabord, la premire approche choisie a t de dterminer les lments de


la phrase qui ntaient pas ncessaires la bonne formation syntaxique de la phrase.
Ainsi, dans cette optique, tous les lments que les grammaires traditionnelles considrent comme effaables (c.f. section 2.1) sont supprims. Bien entendu, cette approche
est acceptable lorsquil sagit de contracter une phrase simple, mais peut donner lieu
des absurdits smantiques ds lors que la phrase se complique ou est inscrite dans
un contexte particulier.
Le gros problme de la tche de contraction consiste donc conserver, en plus de la
correction grammaticale, une certaine correction smantique. Les diffrents obstacles
cette correction dans la premire approche sont :
les lments repris par des anaphores, comme le montre lexemple (2)4
certains complments circonstanciels, qui peuvent avoir une valeur de thme de
la phrase, ou qui permettent parfois (notamment les circonstants de temps) de
rendre cohrent un rcit ou un texte crit.
2. Il leva les yeux vers sa mre. Celle-ci lui sourit.
Une des principales difficults rencontres lors de la dtection de tels phnomnes
et de leur gestion est la complexit des langues naturelles ainsi que leur ambigut.
Mme un traitement qui tiendrait compte de toutes les informations smantique directement disponibles lcrit ne pourrait lever certaines ambiguts, puisque lhumain mme nest parfois pas capable de le faire. Il sagit donc ici de mettre au point
des heuristiques sapprochant le plus possible dun rsultat "juste". Ainsi, en faisant
une tude statistique des textes du corpus utilis, on remarque que la rgle gnrale pour les anaphores est quelles reprennent le syntagme accord en genre et en
nombre le plus proche gauche dans le texte. Bien entendu, cette heuristique nest
utilise quen cas dambigut et si aucune autre rgle ne sapplique. Ceci nest quun
exemple des traitements appliqus au texte analys, la ralit tant bien plus complexe, mais peu accessible au cours dun stage court. Je continue donc par la prsentation des rsultats les plus marquants de ce systme, prsent plus en dtails dans
4

Cet exemple (2) serait contract, dans une premire approche en : Il leva les yeux. Celle-ci lui sourit.

Franois D UPRESSOIR - NSL - 31 aot 2006

Contexte Scientifique

[YMP05, YMP06] et dont une version en ligne est disponible ladresse suivante :
http://www.lirmm.fr/~yousfi/compression.html

1.3.2

Rsultats

Les rsultats sont ici fortement dpendants de la qualit de lanalyse syntaxique


renvoye par SYGFRAN. De plus, lexprience montre que cette mthode est particulirement efficace pour la contraction de textes narratifs5 . Cependant, on remarque
que lexigence pure de compltude syntaxique ne suffit pas garantir la conservation
de la totalit des informations majeures6 , comme le montre lexemple (3), extrait de
[Dod92].
3. Enfin il se changea en pigeon vert. Il se changea.
Comme on peut le voir en utilisant la version disponible en ligne du logiciel, le systme conserve intacts les rsultats de lanalyse syntaxique et ne les supprime que
lors de lapplication dOPALE, dernire tape correspondant souvent un affichage
lcran. Ainsi, un autre ensemble de rgle de marquage pourrait accorder plus dimportance aux adjectifs pithtes et ngliger totalement les complments dagent ou les
circonstants de temps et donner un autre rsultat, suivant le type de texte dentre. Le
systme tient dj compte de certaines informations smantiques qui permettent notamment de traiter les cas cits ci-dessus. Il sagira donc deffectuer une amlioration
du systme existant pour tenir compte dinformations lexico-syntaxiques plus importantes, fournies par lutilisateur ou obtenues de manire automatique par un autre
moyen afin dviter des problmes dambigut smantique tels que celui rencontr
dans lexemple (3), ainsi que pour amliorer le traitement dans certains cas o des lments non traits actuellement sont facultatifs (notamment les complments dobjet).
Nous voici donc en mesure de prciser le sujet du stage la lumire du contexte du
travail existant.

Limportance des lments facultatifs nest, dans ce cas, que purement descriptive et ils napportent
souvent que peu dinformations utiles la comprhension. Dans un article scientifique, par contre, les
adjectifs pithtes ne pourront que rarement tre supprims (Une application surjective).
6
Ici, une "information majeure" est une information qui, si elle est supprime change radicalement le
sens de la phrase ou fait perdre sa cohrence au texte.

Franois D UPRESSOIR - NSL - 31 aot 2006

10

Problmatique du stage
Le but de mon travail au cours de ce stage est donc de trouver une mthode permettant, partir dune ressource lexicale dfinir (existante ou constituer), de dterminer quels lments sont essentiels la compltude syntaxique, puis smantique,
de la phrase et de les marquer comme tels. Ce marquage pourra se faire en amont
dun traitement plus gnral concernant la contraction et ses rsultats doivent tre utilisables aisment dans un tel contexte. Un autre objectif est deffectuer ce travail en
utilisant le minimum dinformations smantiques et en se contentant dinformations
morpho-syntaxiques afin de pouvoir lutiliser avec un systme tel que SYGFRAN. Bien
entendu, toute autre approche est possible. La recherche dun lexique appropri, ou sa
constitution, ncessitera dtudier les thories grammaticales et linguistiques rcentes,
afin de dterminer les informations quil faudra y intgrer pour pouvoir effectuer le
marquage des complments essentiels. Enfin, il sera peut-tre utile deffectuer un relev des diffrents cas dambiguts pouvant se prsenter et qui ne seraient pas traits
(cas marginaux, cas trs difficiles, voire impossibles sans informations smantiques...)
et de proposer des solutions, si possible, aux problmes qui pourraient se poser.

Franois D UPRESSOIR - NSL - 31 aot 2006

11

Contexte Scientifique

Franois D UPRESSOIR - NSL - 31 aot 2006

12

Chapitre 2

Considrations Grammaticales
Afin de pouvoir rsoudre ce problme, il est ncessaire de sintresser de plus prs
ce que linguistes et grammairiens pensent des complments, quils soient dobjets ou
circonstanciels, puisque ceux-ci sont au centre de nos proccupations. Nous verrons
dabord, pour nous rafrachir la mmoire, ce que disent les grammaires dites traditionnelles, souvent plus intuitives, puis nous nous intresserons un type de grammaires
apparues plus rcemment : les grammaires dunification, plus formelles, qui sont apparues avec les exigences lies au traitement automatique des langues naturelles.

2.1

Grammaires traditionnelles

Pour de nombreux grammairiens, les "complments circonstanciels" traditionnels


sont en ralit rpartir dans deux catgories de complments (comprenant les complments dobjet) : les complments essentiels, lis au verbe (dont font partie les complments dobjet), et les complments facultatifs, aussi appels "circonstants" et qui
sont lis la phrase ([Tom01]). La premire difficult surmonter est donc de distinguer complments essentiels et complments facultatifs. Pour cela, nous disposons
de lapproche traditionnelle, qui caractrise le complment essentiel par ses proprits grammaticales. Comme nous lapprenons dans [Tom01, GT04] : le complment du
verbe nest ni dplaable (4), ni effaable (5)1 , et est facilement remplaable par un
pronom (6).
4. Paul mange une pomme. *Une pomme Paul mange.
5. Paul dort son dernier sommeil. Paul dort.
6. Elle vit sa vie. (Sa vie,) elle la vit.
Les circonstants, quant eux, sont dplaables (7), effaables (8), multipliables volont (9), et ne sont pas pronominalisables (10)2 , ce qui permet de les distinguer rapidement des complments essentiels, comme il est crit dans [RPR04].
7. En aot, les jours commencent raccourcir. Les jours commencent raccourcir en aot.
8. Cette anne, lt a t pluvieux. *Lt a t pluvieux.
9. Cette anne, en Alsace, contrairement aux prvisions de la mto, lt a t pluvieux,
au grand dam des vignerons.
10. Pierre a ternu pendant le discours du prsident.
11. Pierre a ternu dans cet htel. (Cet htel,) Pierre y a ternu.
1
2

Ici, la grammaticalit est conserve, mais une nuance importante est perdue
Sauf dans un nombre restreint de cas, notamment les circonstants de lieu (11)

Franois D UPRESSOIR - NSL - 31 aot 2006

13

Considrations Grammaticales

De plus, cette approche propose des mthodes pour diffrencier aisment les divers
type de complments du verbe. En particulier, il peut tre intressant de savoir identifier les complments dobjet (4) et les attributs du sujet (12), qui sont souvent obligatoires et ne permettent en gnral de ne supprimer que quelques mots.
12. Jrmy est maladroit.
Linconvnient majeur dune telle approche dans le contexte qui nous intresse est la
difficult de lautomatiser. En effet, comment tester de manire algorithmique des notions de bonne formation smantique ? Il faut donc, pour pouvoir analyser, et rsumer,
un texte de manire automatique, mettre au point une nouvelle approche de la syntaxe. Cest ce qui a t fait par les linguistes avec le dveloppement des grammaires
dunification.

2.2

Grammaires dunification

Les grammaires dunification se sont dveloppes en marge du modle syntaxique


traditionnel "chomskyen" pour dune part, unifier ltude de la syntaxe avec celle du
lexique et de la smantique, et dautre part, permettre, par une formalisation plus
explicite, des applications en traitement automatique des langues. [Abe93] prsente
assez bien cette famille de grammaires, en explicitant les plus rpandues et en les appliquant en partie la langue franaise. Voici une courte prsentation de lune dentre
elles, plus particulirement adapte au travail fournir ici.

2.2.1 Lexical functional grammar (LFG)


La grammaire lexicale fonctionnelle (lexical functional grammar ou LFG), a t dfinie la fin des annes 70 par J. B RESNAN et R. K APLAN dans [Bre82]. Ce modle est
moins complexe que les grammaires gnratives transformationnelles utilises jusqualors3 . Lide est de dcrire la phrase non seulement au niveau de ses dpendances
syntaxiques, reprsentes par la structure de constituants (ou structure c), mais aussi
au niveau des dpendances lexicales , reprsentes par une structure de traits, dite
structure fontionnelle (ou structure f). Le rsultat est une structure arborescente dont
les noeuds sont tiquets non seulement par les informations syntaxiques, mais aussi
par des informations de dpendance lexicale.
Les figures 2.1 et 2.2, tires de [Abe93], montrent lutilit linguistique de cette reprsentation deux niveaux. En effet, deux phrases smantiquement proches ont une
reprsentation arborescente (structure c, sur la figure 2.1) trs diffrentes lune de
lautre, mais leurs structures f (sur la figure 2.2) sont trs proches. On remarque dj
dans ces structures f simplifies un point central des grammaires dunification, et en
particulier de LFG : lorganisation base de prdicats (Pred), instaurant une hirarchie dans la phrase ou le syntagme, gouvern par une tte dont dpendent les autres
syntagmes. Ainsi, une phrase bien forme correspondront une structure c, obtenue
par drivation de rgles de grammaire hors-contexte dotes dune description fonctionnelle4 , et une structure fonctionnelle, dfinie comme la structure de traits mini3

LFG est, dans le pire cas, quivalent une grammaire contextuelle, contrairement aux grammaires
gnratives la Chomsky
4
Un ensemble dquations dcrivant la structure fonctionnelle normalement associe larbre de drivation.

Franois D UPRESSOIR - NSL - 31 aot 2006

14

Considrations Grammaticales

P
qMMMM
q
q
MMM
q
qqq

P
qVVVVVV
q
q
VVVV
q
VVV
qqq
SN

Peter

SN

SV

qMM
qqq MMMMM
q
q
q

SN

admires

Mary

SN

Petrus puellam

amat

F IG . 2.1 Structures c de phrases smantiquement proches en anglais et en latin

Suj = [Pred = Peter]

Pred = admire

Obj = [Pred = Mary]


Pierre admire Marie

Suj = [Pred = Petrus]

Pred = amare

Obj = [Pred = puella]


Pierre aime la jeune fille

F IG . 2.2 Structures f correspondantes

male satisfaisant la description fonctionnelle. Cest dans la recherche de cette structure


fonctionnelle quintervient lunification. La figure 2.3 reprsente lunification dun
ensemble de rgles. Un chec de lunification signifierait que la phrase nest pas bien
forme au vu des rgles fournies.
Les structures f un peu plus compltes reprsentes sur la figure 2.3 contiennent des
informations dites de "sous-catgorisation" la suite du prdicat, indiquant les syntagmes imposs par le prdicat (la tte du groupe). Ainsi, dans lexemple, "dort" ne
demande quun sujet.
Lunification permet donc dtiqueter un arbre syntaxique et den extraire la structure
f correspondante la phrase quil reprsente, la condition de disposer des informations concernant la description fonctionnelle, et particulirement la sous-catgorisation,
de chacun de ses noeuds. En particulier, il est trs important de connatre, en gnral et plus spcialement pour effectuer la reconnaissance dlments importants de la
phrase, la sous-catgorisation des verbes, qui gouvernent souvent les syntagmes o
ils se trouvent.

2.2.2

Le Lexique-Grammaire

tablir la sous-catgorisation de tous les verbes dune langue naturelle, dans tous
leurs emplois et toutes leurs acceptions est un travail de titan. Cependant, Maurice
G ROSS et son quipe ont commenc, dans [Gro75], crire des tables reprsentant la
sous-catgorisation des verbes courants du franais, regroups par type de construction.
De nombreux travaux en TAL, notamment les travaux de la communaut I NTEX, sappuient sur les rsultats de G ROSS, qui est srement la base de donnes lexicale la plus
exhaustive ce jour en ce qui concerne les traits de sous-catgorisation.
Cette ressource pourra donc tre utilise par la suite pour la constitution dune res-

Franois D UPRESSOIR - NSL - 31 aot 2006

15

Considrations Grammaticales

P
V

SN

SN
(Suj)=
dort
(Num) = sing
(Mode) = indicatif
(Pers) = 3
(Pred) = dormir<Suj>
Jean
(Num) = sing
(Num) = masc
(Num) = Jean

V
=

qMM
qqq MMMMM
q
q
q

(Suj)=
SN

=
V

Pred = Jean


Suj = Genre = masc

Num = sing

Pred = dormir<Suj>

Mode = indicatif

Num = sing
Pers = 3

Jean
dort
structure c

structure f

F IG . 2.3 Exemple dunification

Franois D UPRESSOIR - NSL - 31 aot 2006

16

Considrations Grammaticales

source lexicale, mais est aussi intressante dun point de vue plus thorique pour
mieux comprendre le fonctionnement global des grammaires dunification et avoir
un aperu plus complet du problme.

Franois D UPRESSOIR - NSL - 31 aot 2006

17

Considrations Grammaticales

Franois D UPRESSOIR - NSL - 31 aot 2006

18

Chapitre 3

Marquage des complments


3.1

Principes et choix thoriques

La ralisation dun systme rpondant au problme pos passe, comme nous lavons
indiqu plus haut par lutilisation ou la construction dune ressource lexicale adapte
lapproche choisie. Nous verrons dabord ce qui a orient ce choix, puis comment ce
choix a lui-mme influenc la cration du lexique.

3.1.1

Choix dune approche particulire

Jai tout dabord approch le travail effectuer dun point de vue trs gnral, en
envisageant de crer un systme capable, partir dune ressource lexicale, de produire automatiquement un ensemble de rgles TELESI correspondant aux informations contenues dans le lexique. Jai beaucoup avanc dans cette direction, en tentant
de structurer les diffrentes constructions lexico-syntaxiques et dtablir un ordre partiel sur lensemble les contenant. Il suffirait alors, lorsquun verbe est rencontr, de
remplacer la construction C o il apparat par une construction C 0 minimale vis--vis
de lordre impos telle que C 0 est plus petite que C dans ce mme ordre.
Cest en changeant propos des diffrentes dfinitions possibles dune telle relation
dordre avec Augusta M ELA quil est apparu quune telle opration, mene de manire
statique, sapprochait, sans atteindre leur efficacit, des diffrentes mthodes affrentes aux grammaires dunification. Le principal inconvnient de cette mthode tait
son aspect de compilation statique dune ressource lexicale, qui empchait dinclure
au traitement des informations smantiques qui pourraient tre extraites de manire
dynamique. De plus, il est trs difficile dcrire (en particulier de manire automatique) des rgles TELESI cohrentes. Au fil des diffrentes runions qui ont suivi, mon
travail sest donc orient plus particulirement vers ltude des grammaires dunification et vers leurs possibilits dutilisation dans le contexte du stage. Il ma donc fallu
tudier un corpus (compos du conte polynsien prsent en annexe A.1 et des deux
premiers chapitres de [dSE43]) afin de dterminer quelles informations sur les verbes
taient ncessaires pour distinguer les complments essentiels des complments facultatifs.

3.1.2

Constitution du lexique

Voici une description de ce que devra contenir la ressource lexicale qui sera finalement utilise, la lumire des considrations grammaticales du chapitre 2.
Pour dcrire le contenu de cette ressource, la figure 3.1 reprsente quelques entres
du lexique "idal", crites dans un langage non-spcifique, qui se veut le plus explicite

Franois D UPRESSOIR - NSL - 31 aot 2006

19

Marquage des complments

possible. La ressource elle-mme devra bien entendu tenir compte des formats dentre attendus par le systme utilis pour effectuer lanalyse, ainsi que de celui utilis
pour effectuer le marquage, qui pourraient ventuellement tre tous deux diffrents
de SYGMART.
Lgende et explication de la figure 3.1
Le champ L EMME contient le lemme verbal, sa racine infinitive. Il est utile, de manire
vidente, de connatre le verbe auxquelles sappliquent les informations donnes dans
la suite du tableau.
Le champ F ORME donne des informations prcises sur la forme verbale, qui peut fortement influencer limportance des diffrents lments de la phrase1 . En particulier,
il indique les formes passives, impersonnelles, et rflchies. Il sera donc aussi ncessaire de dtecter, dans certains cas o SYGFRAN nest pas efficace, ces diffrentes
voix/constructions.
13. Jean a lav le sol. <Suj :SN ;Obj :SN,SCOMP>
14. Jean sest lav (/le corps/les mains). <Suj :SN ;(Obj :SN[partie du corps])>
Il peut prendre trois valeurs ou toute combinaison de ces trois valeurs : Pas pour les
voix passives, Imp pour les constructions impersonnelles, et Ref pour les constructions
rflexives.
Le champ A UXILIAIRE contient lauxiliaire avec lequel se construisent les temps composs du verbe. En effet, celui peut varier suivant la voix, lacception ou dautres facteurs (comme illustr dans les phrases (15) et (16)). A priori, cette information nest que
peu utile, mais elle peut peut-tre mener une diminution du nombre de cas dambiguts suivant le corpus. Ce champ na que deux valeurs possibles : tre ou avoir. Il
est envisageable, mais je ne lai pas recontr dans le corpus, quun verbe puisse tre
construit avec les deux auxiliaires indiffremment.
15. Il sest chang trois fois aujourdhui.
16. Il a beaucoup chang ces derniers temps.
Pour comprendre les deux champs suivants, il nous faut savoir ce quest un verbe
support. Dans [RPR04, VII-1.4.8, p. 232], les verbes supports sont des verbes qui,
ct de leurs emplois ordinaires, peuvent se combiner avec un nom, un adjectif ou un
groupe prpositionnel pour construire une forme complexe fonctionnellement quivalente un verbe. De plus, cette forme complexe a ses propres caractristiques, ainsi
quun sens diffrent, ce qui justifie une entre spare dans le lexique.
Ltude du corpus nous montre quil est ncessaire, pour analyser et traiter correctement les verbes supports, de connatre la fois la catgorie grammaticale de llment
support (C AT S UP), et, bien entendu, son lemme(L EM S UP). En effet, le lemme est ncessaire, mais quelques exemples ((17) et (18), par exemple), rares, mais importants
car ils ont dautres consquences, rendent ncessaire la connaissance de la catgorie.
17. "Faire le beau", C AT S UP=N, L EM S UP="beau", S UB C AT=<Suj :SN>
18. "Faire beau", F ORME=Imp, C AT S UP=Adj, L EM S UP="beau", S UB C AT=<Suj :Il>
1
Les phrases (13) et (14) montrent limportance, par exemple, de dtecter une forme rflchie qui
modifie la sous-catgorisation du verbe laver.

Franois D UPRESSOIR - NSL - 31 aot 2006

20

L EMME
partir
tre
manger
faire
faire
faire
faire
faire
gronder
protester
moquer
mettre
pousser

F ORME

Impersonnel

Rflexif

A UXILIAIRE
tre
avoir
avoir
avoir
avoir
avoir
avoir
avoir
avoir
avoir
tre
tre
avoir

C AT S UP
Prep()

N
N
N

L EM S UP
recherche

attention
exprience
connaissance

S OUS - CATGORISATION (S UB C AT )
<Suj :SN,SINF,SCOMP ;Obj :de-SN>
<Suj :SN,SINF,SCOMP ;AttSuj :SN,Adj>
<Suj :SN ;(Obj :SN,SCOMP)>
<Suj :SN,SINF,SCOMP ;Obj :SN>
<Suj :"Il" ;Obj :SN-mto,Adj-mto>
<Suj :SN,SINF,SCOMP ;(Obj :-SN,-SINF)>
<Suj :SN,SINF,SCOMP ;(Obj1 :de-SN ;Obj2 :sur-SN)>
<Suj :SN ;Obj :de-SN>
<Suj :SN ;Obj :SN-humain>
<Suj :SN,SCOMP>
<Suj :SN,SCOMP ;Obj :de-SN>
<Suj :SN,SCOMP ;Obj :-SINF>
<Suj :SN ;Obj1 :SN ;Obj2 :-SINF>

P ROPRITS

C TRL S UJ
C TRL O BJ

Marquage des complments

F IG . 3.1 Extrait du lexique


Franois D UPRESSOIR - NSL - 31 aot 2006

21

Marquage des complments

Le premier a trois valeurs possibles, correspondant aux trois catgories possibles,


daprs Riegel et al. : N pour un nom ou un syntagme nominal, Adj pour un adjectif, et Prep pour un groupe prpositionnel.
Le champ S UB C AT contient les informations de sous-catgorisation proprement dites,
savoir les complments imposs par le verbe. Plusieurs informations sont apportes
pour chaque complment. Tout dabord sa fonction syntaxique (Sujet (Suj), Complment dObjet (Obj), Attribut (Att)...), puis les catgories grammaticales possibles pour
chaque fonction (syntagme nominal (N), adjectif (Adj), adverbe (Adv), subordonne
compltive (SCOMP)...) et enfin, des informations plus prcises sur la catgorie smantique du complment (humain, partie du corps, anim, comestible...). Les diffrentes valeurs possibles sont susceptibles dtre modifies suivant le corpus tudi,
et il serait long et inutile den faire ici un inventaire complet. Cependant, une tude
complte serait bien entendu ncessaire pour tre en mesure de fournir un systme
oprationnel, ne serait-ce que sur un petit ensemble de textes.
Cette sous-catgorisation prsente la particularit de contenir aussi des lments essentiels "facultatifs". Ces lments apportent des prcisions qui, si elles sont supprimes, peuvent engendrer une ambigut smantique. Ainsi, ces lments, prsents
entre parenthses dans le lexique, ne sont pas obligatoires, mais ne doivent pas tre
supprims, au moins dans une premire approche, sils sont prsents.
Le dernier champ, P ROPRITS, contient des informations supplmentaires, relatives
la construction de la phrase elle-mme, et permettant daffiner lanalyse en constituants. En particulier, on y mettra des informations relatives des formes passives
irrgulires, ou plus souvent les informations concernant lventuel accord (contrle)
dune proposition infinitive complment2 . Une proposition infinitive peut aussi tre
impersonnelle et transmettre cette caractristique la principale, avec certains verbes,
comme dans lexemple (21). Cette information sera aussi donne par ce champ.
19. Je dois aller me laver.
20. Je lui ai dit daller se laver.
21. Il devrait pleuvoir.
Au cours de mes recherches, il sest avr quaucune ressource lexicale existante
ne fournissait la totalit de ces informations. Il sera donc ncessaire de construire cette
ressource au fur et mesure des exprimentations, en tenant compte du fait quune
entre reprsente une acception dun verbe et non son lemme, puisque certains verbes
peuvent avoir plusieurs acceptions possdant des caractristiques distinctes3 .

3.2

Ralisation du marquage

Disposer de ces informations ne suffit pas, en soi-mme effectuer lopration


souhaite. Encore faut-il pouvoir, et savoir les utiliser. Je dcrirai ici les rgles les plus
gnrales possibles, tout en sachant, et en prcisant, quune ralisation pratique sous
forme dune grammaire TELESI devra bien entendu tenir compte de lanalyse SYG FRAN sur lentre et grer de nombreux cas particuliers (pronominalisations, flexions
2

Le contrle de linfinitif est llment qui sert de sujet la proposition. Ce contrle peut-tre le sujet
de la phrase principale (ex. (19)), ou son complment dobjet ((20)).
3
la principale consquence est une ambigut qui apparat la lecture du dictionnaire, puisque celle-ci
peut renvoyer plusieurs entres si la slection ne seffectue que sur le lemme

Franois D UPRESSOIR - NSL - 31 aot 2006

22

Marquage des complments

des dterminants...). Plusieurs approches taient possibles, ici encore. Jai choisi ici un
approche en couches successives permettant encore un raffinement des critres de slection et de traitement diffrents niveaux.
La premire couche (3.2.1) se chargerait de "corriger" lanalyse SYGFRAN en remarquant bien les constructions particulires (formes impersonnelles, formes rflchies et
voix passives), ce qui, en plus de rendre lanalyse plus pertinente, peut permettre de
rduire fortement le nombre dentres considrer dans le dictionnaire en affinant le
filtrage.
Une deuxime couche (3.2.2) se chargerait de rpertorier, pour toutes les formes verbales, lensemble des syntagmes potentiellement sous-catgoriss (tous les groupes
syntaxiques qui pourraient tre complments de ce verbe).
La troisime couche (3.2.3) effectuerait alors le traitement proprement dit, considrant
chaque complment potentiel et vrifiant sa prsence dans les entres du lexique correspondantes. Si le groupe est prsent dans toutes les entres avec la mme fonction,
on lui affecte cette fonction. Sinon, sil existe une entre o ce groupe est prsent, on
divise larbre comme sur lexemple danalyse ambigu 1.3 et on continue lanalyse.
Dans le cas o aucune des entres lexicales ne sous-catgorise un lment de la nature
souhaite, alors ce groupe est un complment de phrase ou dpend dun autre verbe
dans la phrase.
Enfin, une quatrime couche permettrait de remettre en forme larbre danalyse syntaxique en plaant les complments du verbe sous le groupe verbal.

3.2.1

Pr-traitement : Mise en forme de lanalyse SYGFRAN

Formes rflchies
Pour ce point, au moins dans les cas gnraux, SYGFRAN dtecte bien les emplois rflchis des verbes. Le groupe verbal possde alors ltiquette VOIX=(PRONOM).
Dans le cas o lexprience mettrait en vidence une dfaillance de SYGFRAN pour
mettre en vidence les emplois rflexifs, il est possible dcrire un ensemble de rgles
simples analysant la personne et le nombre du sujet et vrifiant quil saccorde avec le
pronom aprs avoir vrifi que celui-ci est sous une forme rflchie (me, se, nous, vous).
Si lexprience montre nouveau que cela ne suffit pas encore, on pourra marquer
comme "potentiellement rflchi" tout emploi dun verbe avec un pronom sous forme
rflchie et lui appliquer la fois les rgles des formes rflexives et celles des formes
classiques lors du traitement.
Formes impersonnelles
En dehors des cas o le verbe est purement impersonnel (verbes mtorologiques,
de survenance ou modalisateurs, par exemple (22), (23) et (24)), la dtection des formes
impersonnelles nest pas aise si on ne considre que des informations lexico-syntaxiques.
En effet, la prsence du pronom il en tant que sujet ne suffit pas, heureusement pour
la communication et malheureusement pour lanalyse, donner un sens impersonnel
au verbe ((25) et (26)).
22. Il pleut.
23. Quoi quil advienne.
24. Il faut manger tes pinards.

Franois D UPRESSOIR - NSL - 31 aot 2006

23

Marquage des complments

1
qMMMM
q
q
MMM
q
qqq
2

qMM
qqq MMMMM
q
q
q

K(3)=GV, CAT(4)=V,
PROP(4)3TRSF_IMP,
K(5)=PHINF, TYP(5)3IL,
LEMME(2)="il"

+3

1
qMMMM
q
q
MMM
q
qqq
2

qMM
qqq MMMMM
q
q
q

TYP(4)IL
TYP(3)IL

F IG . 3.2 Rgle : propagation des formes impersonnelles infinitives

25. Il/Jean est arriv 5 heures.


26. Il/*Jean est arriv quelque chose.
Tout dabord, le caractre intrinsquement impersonnel dun verbe peut, dans certains
cas et lorsquil est infinitif complment, tre transmis au verbe principal (27). La rgle
la plus gnrale correspondante pourrait scrire 3.2. Ensuite, un verbe peut possder plusieurs emplois dont un ou plusieurs sont impersonnels ((25) et (26)). Comme,
dans ces cas, lanalyse dpend fortement du contexte, que nous tenons carter du
prtraitement4 , tout verbe dont le sujet est le pronom il sera marqu comme "potentiellement impersonnel" et recevra un double-traitement lors de la dsambiguisation.
Parfois, le choix sera rapidement effectu au cours de ltape de traitement proprement
dite (3.2.3), par exemple, aprs la dtection des formes supports (section 3.2.3) comme
dans la phrase (28) o la dtection de la forme support faire(adj. "beau") imposera la
forme impersonnelle au verbe.
27. Il devrait pleuvoir, aujourdhui.
28. Il fait beau.
Voix passive
Une des principales difficults de la dtection des verbes la voix passive est leur
proximit structurale avec les temps composs. Il faut donc trouver des diffrences
entre les constructions passives et actives composes dun mme verbe pour les distinguer. En particulier, la dtection dun complment dagent introduit par la prposition
par permet une dtermination quasi-immdiate. En revanche, la distinction peut-tre
plus difficile faire si les diffrences sont plus fines, voire purement smantiques5 . Le
travail de dtection immdiate des formes passives tant assez bien effectu par SYG FRAN , il suffit de ddoubler larbre syntaxique dans certains cas ambigus (notamment
4

Le prtraitement vise justement ici extraire les informations immdiates


Il sagit ici de dtecter les verbes la voix passives et non les constructions sens passif. Une telle
dtection pourrait tre utile dans le cadre dune reformulation ou dune analyse smantique, mais est ici
inutile
5

Franois D UPRESSOIR - NSL - 31 aot 2006

24

Marquage des complments

(29), analys comme lauxiliaire tre suivi de son attribut du sujet) pour avoir une analyse plus complte.
Lexemple (29) illustre trs bien le propos car, suivant la manire dont on analyse la
forme verbale sont nourries, le complment au grain est essentiel6 (auxiliaire + attribut
du sujet) ou facultatif (passif, au grain peut mme tre considr comme lagent tout
en restant facultatif).
29. Ces poules sont nourries au grain.
On pourrait inclure dans ce pr-traitement la dtection des verbes supports, mais encore une fois, le but ici est de dduire autant dinformations que possible de lanalyse
elle-mme sans se servir de la ressource lexicale. Cette dtection pourra donc se faire
au cours de la troisime tape, o la ressource lexicale sera utilise.

3.2.2

Reprage des complments potentiels

Dans cette tape, il sagit de faire linventaire de tous les groupes syntaxiques potentiellement rattachs un mme verbe. Ces groupes seront ensuite analyss la
lumire du lexique et retenus, ou non, en tant que complments du verbe en question.
Nous ne prendrons ici que les noeuds frres du groupe verbal tudi (pour retenir les
sujets et les complments essentiels qui seraient analyss par SYGFRAN comme des
complments circonstanciels), et ses descendants (pour retenir tous les groupes initialement analyss comme des complments dobjet, complments dagent, attributs du
sujet, attributs de lobjet...). On peut ensuite placer chacun des lments retenus, sans
plus de slection, dans une tiquette du nud correspondant au verbe. On pourra utiliser pour les identifier les numros de nud renvoys par SYGFRAN lors de lanalyse.
Une difficult supplmentaire, due limperfection de lanalyse SYGFRAN peut apparatre si le verbe considr fait partie dune subordonne compltive dont les complments sont mal analyss. Je nai ce jour pas de solution proposer, ces cas tant
relativement rares dans les textes considrs. Une solution, trop coteuse pour tre
envisageable serait de considrer tous les syntagmes de la phrase, mais je prfre me
reposer sur lhypothse dune analyse correcte et complte, quil est toujours possible
denvisager, quitte rajouter un pr-traitement supplmentaire.
la fin de cette tape, chaque verbe de la phrase dispose donc de la liste des syntagmes susceptibles dtre gouverns par lui. Il "suffit" maintenant de parcourir cette
liste en liminant les syntagmes qui ne sont clairement pas complments du verbe et
en marquant ceux qui, aprs comparaison avec les entres du lexique, pourraient en
tre.

3.2.3

Traitement : lecture du lexique et marquage des complments

La premire chose faire au cours du traitement proprement dit est de reprer les
constructions grammaticales les plus courantes qui nont pas t reconnues la premire tape (c.f. 3.2.1). Parmi ces constructions, les constructions verbes supports ont
une importance particulire puisque, comme nous lavons vu, leur prsence entrane
dimportantes modifications de la sous-catgorisation du verbe et de ses caractristiques.
6

dun point de vue smantique, la syntaxe se fichant pas mal du droit des animaux

Franois D UPRESSOIR - NSL - 31 aot 2006

25

Marquage des complments

1
qMMMM
q
q
MMM
q
qqq
2

1
+3

2
6
qqMMMMM
q
q
MM
qqq
4

K(2)=GV, K(3)=GN,
CAT(4)=V,
L E X S U P (DICT(4))=LEMME(5),
C A T S U P (DICT(4))=CAT(5)

K(6)=VSupp,
LEMME(6)LEMME(4),
LEXSUP(6)LEMME(5),
CATSUP(6)CAT(5)

F IG . 3.3 Rgle : traitement des verbes supports

Dtection des formes supports


Les constructions verbes supports sont elles aussi assez difficiles dtecter bien
quelles ne diffrent que peu des formes figes qui, elles, sont faciles reprer. En effet, les formes supports peuvent subir des flexions (30), voire des inversions ou des
anaphores (31), comme toute autre construction non-fige. Cependant, il est ncessaire, mme dans ces cas, de les dtecter, puisque la sous-catgorisation du verbe est
modifie.
30. Jean a de ladmiration pour Marie./Jean a une certaine admiration pour Marie.
31. Le jugement que Jean porte sur ton livre est positif.
Je ne traiterai pas ici le cas des anaphores, mais des heuristiques permettraient de
savoir avec une bonne probabilit quel lment se rapporte la conjonction ou le pronom et de se ramener au cas tudi ci-dessous.
Pour dtecter une forme support, il faut dabord trouver la lexie ventuellement supporte par le verbe. Une fois celle-ci dtecte, on place dans le groupe verbal, sous un
nouveau noeud VSUPP contenant le lemme verbal, lensemble du syntagme la contenant. Cela donnerait une rgle du type de la figure 3.3, o DICT(x) est une lecture du
dictionnaire avec le filtre form par les tiquettes du noeud x.
Marquage effectif
Au cours de ce traitement, il faut, pour chaque verbe, parcourir le trait de souscatgorisation des diffrentes entres du lexique correspondantes la forme dtecte
(le filtrage peut se faire sur le L EMME, la F ORME et lA UXILIAIRE, puisque la premire tape (3.2.1) a permis de les dterminer avec prcision. chaque fonction souscatgorise par le verbe, on essaye ensuite dassocier un des syntagmes dtects lors
de la deuxime tape du prtraitement (3.2.2). Si plusieurs lments peuvent remplir
une mme fonction, on peut soit ddoubler larbre danalyse, soit mettre en place des
algorithmes approchs permettant den slectionner un unique. Enfin, les seules acceptions du verbe possibles sont celles qui ont reconnu tous leurs complments. Sil

Franois D UPRESSOIR - NSL - 31 aot 2006

26

Marquage des complments

en reste plusieurs, on peut procder de mme, soit une division de larbre, soit une
slection grce des heuristiques approches. La premire solution reste privilgier
dans ce cas, puisque rien nassure quun des syntagmes choisis nest pas en ralit
complment dun autre verbe. Ddoubler larbre danalyse permettrait alors deffectuer un traitement plus exhaustif, autorisant les impasses, qui seront lagues par la
suite.
Cest au cours de cette tape, plus particulirement, que pourront tre utilises les mthodes issues des grammaires dunification. En effet, si on associe la sous-catgorisation
des quations fonctionnelles, comme dans LFG (c.f. 2.2), la slection des complments
se fait de manire beaucoup plus fine (en particulier en rendant leur importance aux
informations morphologiques de genre et de nombre), laissant la place moins dambiguts.

3.3

Rsultats et dveloppements futurs

La dure du stage et la complexit du problme ne mont pas permis darriver un


stade de dveloppement suffisamment avanc pour produire un rsultat utilisable. De
plus, lintgration dun systme gnral dans la chane SYGFRAN existante, construite
bases dexpriences particulires ne se fera que difficilement, si elle se fait. Cependant on peut dj dire que, si un tel systme permettra une plus grande cohrence de
la compression des phrases, il en rduira sensiblement lefficacit en termes de taux
de compression. Enfin, les rsultats seront toujours imparfaits puisque certains phnomnes, mme courants, de la langue ne sont pas traits.
Pourtant, mme si je nai pas atteint un stade suffisant pour produire un systme fonctionnel, je pense avoir atteint une bonne comprhension gnrale des problmes inhrents au TAL et la contraction de phrase. Ainsi, mon tude a permis lquipe de
faire, ou refaire, certaines constatations sur les choix intiaux de la conception de SYG FRAN et ma permis de prendre conscience de lampleur du travail fournir en TAL,
autant en termes de travail thorique gnral (notamment dans le domaine des grammaires formelles) quen termes dtude fine de cas particuliers rcurrents (problmes
de linguistique).

Franois D UPRESSOIR - NSL - 31 aot 2006

27

Marquage des complments

Franois D UPRESSOIR - NSL - 31 aot 2006

28

Conclusion
Les travaux que jai effectus durant ce court stage, mme sils nont pas men
des rsultats directement utilisables, auront permis, je pense, aux membres de lquipe
TAL de revoir SYGMART, non comme un systme exprimental sur lequel fournir un
travail pratique permettant den prouver lefficacit, mais aussi comme un systme
suffisamment proche des nouvelles thories de la grammaire pour quelles puissent y
tre adaptes efficacement.
Le travail fourni au cours de ce mois et demi mrite dtre approfondi, non seulement
pour son intrt pratique et ses applications, mais aussi pour les questions thoriques
quil suscite, en particulier sur la compatibilit du systme de transformations que reprsente SYGMART avec les grammaires dunification (LFG ou une autre). Pour rendre
utilisables et testables les ides qui ont merg de mon travail, une formalisation des
rgles et leur criture au format TELESI, ainsi que la constitution dun lexique plus
complet grce ltude dun corpus plus tendu seront ncessaires.
Jespre pouvoir, pour ma part, travailler nouveau, si ce nest sur SYGMART mme,
dans un domaine proche du TAL, car ces premiers pas dans le monde de la recherche,
et dans un domaine aussi complexe que le traitement des langues naturelles, mont
persuad du travail phnomnal quil reste accomplir dans ces domaines nouveaux,
aux frontires de plusieurs disciplines.

Franois D UPRESSOIR - NSL - 31 aot 2006

29

Conclusion

Franois D UPRESSOIR - NSL - 31 aot 2006

30

Liste des annexes


A Extrait dun conte polynsien
33
A.1 Texte Initial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.2 Rsultat de la compression . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Franois D UPRESSOIR - NSL - 31 aot 2006

31

LISTE DES ANNEXES

Franois D UPRESSOIR - NSL - 31 aot 2006

32

Annexe A

Extrait dun conte polynsien : La


Lgende de Maui [Dod92]
A.1

Texte Initial
Maui part la recherche de ses parents.

A partir de ce soir-l, Maui fut le favori de sa mre : mme sil faisait


des btises, elle ne le grondait pas. Quand ses frres protestaient, il se moquait deux parce quil savait avoir la protection de sa mre. Mais pendant
son absence, il devait faire attention ne pas dpasser les limites, sinon il
risquait dtre puni par eux au cours de la journe.
Une nuit, Maui imagina un tour jouer sa mre afin de dcouvrir o
elle allait. Une fois tous les autres endormis sur leurs nattes, il se releva
et fit le tour de la maison, examinant les grands stores tresss qui la fermaient pour la nuit. Partout o filtrait la clart dune toile, il bouchait vite
louverture avec des toffes dcorce et calfeutrait mme les fentes avec des
roseaux. Puis il droba le manteau, la ceinture et la couronne de sa mre et
les cacha en se disant quil en aurait besoin plus tard.
Maui reprit alors sa place sur les nattes et dcida de rester veill. La
longue nuit passa lentement sans que sa mre ne bouge. Quand vint le matin, pas un rai de lumire ne put percer pour veiller les dormeurs. Bientt
ce fut lheure o le soleil grimpait au-dessus de lhorizon. Dhabitude Maui
pouvait distinguer dans la pnombre les formes des pieds de ses frres
lautre bout de la maison, mais ce matin il faisait trop noir. Et sa mre continuait dormir.
Au bout dun moment elle bougea et marmonna : Quelle sorte de nuit
est-ce donc pour durer si longtemps ? Mais elle se rendormit parce quil
faisait aussi noir quau coeur de la nuit dans la maison.
Finalement elle se rveilla en sursaut et se mit chercher ses vtements.
Courant de tous cts, elle arracha ce que Maui avait fourr dans les fentes.
Mais ctait le jour ! Le grand jour ! Le soleil tait dj haut dans le ciel ! Elle
sempara dun morceau de tapa pour se couvrir et se sauva de la maison,
en pleurant la pense davoir t ainsi trompe par ses propres enfants.
Sa mre partie, Maui bondit prs du store qui se balanait encore de
son passage et regarda par louverture. Il vit quelle tait dj loin, sur la
premire pente de la montagne. Puis elle sarrta, saisit pleines mains

Franois D UPRESSOIR - NSL - 31 aot 2006

33

Extrait dun conte polynsien

un arbuste de tiare Tahiti, le souleva dun coup : un trou apparut, elle sy


engouffra et remit le buisson en place comme avant.
Maui jaillit de la maison aussi vite quil put, escalada la pente abrupte,
trbuchant et tombant sur les mains car il gardait les yeux fixs sur larbuste de tiare. Il latteignit finalement, le souleva et dcouvrit une belle
caverne spacieuse qui senfonait dans la montagne.
Plus tard, tandis que ses frres taient trs affairs se baigner dans le
frais ruisseau et chercher un fruit de larbre pain se mettre sous la
dent, Maui les questionna : O croyez-vous donc que notre pre et notre
mre passent la journe ?
Comment le saurions-nous ? Et pourquoi te tracasses-tu avec a ? Tu
ne peux donc pas vivre tranquillement avec nous ? Que nous importe notre
pre ou notre mre ? Est-ce quelle nous a levs avec de la bonne nourriture ? Pas du tout : elle tait toujours partie. Peut-tre bien que le grand
Taaroa, dieu du ciel, est notre pre et quil a envoy ses enfants ici-bas
pour soccuper de nous ! Niu-Hiti, la douce brise qui rafrachit la terre et les
jeunes plantes ; Hau-Rii, le vent humide qui les mouille ; Hau-Roto-Roto, le
beau temps qui les fait pousser ; Tou-Arii, le dieu de la pluie qui les arrose,
et son frre, Ti-Arii, qui les nourrit de ses roses. Taaroa a envoy toute
sa famille pour permettre notre nourriture de pousser. Ensuite Papa, la
grande desse mre de la terre, a fait germer ses graines pour nous tous
qui sommes ses enfants.
Mais oui, bien sr, leur rpondit le petit Maui, tout ce que vous dites
est vrai. Cest mme encore plus vrai pour moi que pour vous, parce que
cest la mer qui a t ma nourrice et ses bouillonnements dcume mon lait.
Vous, vous avez t nourris au lait de notre mre avant de pouvoir manger
dautres nourritures. Mais moi, mes frres, je nai jamais tt son sein, ni
rien mang de sa main. Et pourtant je laime pour lunique raison quelle
ma port en elle, et cest parce que je laime que je souffre de ne pas savoir
o elle se trouve avec mon pre.
Ses frres se sentirent surpris et charms par le petit Maui quand ils
lentendirent parler de cette faon. Aprs avoir rflchi un moment ce
quil avait dit, ils lapprouvrent et lencouragrent tenter de trouver leur
pre et leur mre.
Maui ne se tint plus de joie. Il se mit tout de suite faire la magie dont il
savait avoir besoin pour pntrer dans la caverne sous larbuste de tiare et
trouver son chemin souterrain dans lautre monde. Il allait devoir voyager
vite et il dcida de se changer en oiseau. Il ne savait pas quel oiseau choisir.
Il pensa bien sr au noha, le ptrel qui niche dans un terrier de la montagne,
mais il le jugea trop gros. Il se fit maho, marouette fuligineuse, mais ses
frres pensrent quil tait trop petit et pas joli. Puis il devint otaha, grande
frgate noire, mais ils trouvrent effrayante cette crature aux ailes plus
longues que leurs bras. Alors il essaya un oiseau aprs lautre, le uriri,
petit chevalier voyageur la voix claire et hardie, le tarapapa, hirondelle de
mer bruyante la voix gutturale, le kivi, courlis chasseur des petits crabes
rouges, au long bec courb comme un manche doutil, le otuu, aigrette
sacre qui tangue sur ses hautes chasses, le torea, pluvier dor, puis le ao,
fou brun, et le uaao, fou pieds rouges, trop comiques, et puis le itatae

Franois D UPRESSOIR - NSL - 31 aot 2006

34

Extrait dun conte polynsien

tout blanc et le oa tout brun, jusqu ce quil ait pris lapparence de tous les
oiseaux du monde, tour tour. Enfin il se changea en pigeon vert.
Extrait de La Lgende de Maui. [Dod92]

A.2

Rsultat de la compression
Maui part la recherche de ses parents.

A partir de ce soir-l, Maui fut le favori de sa mre : elle ne le grondait


pas. Quand ses frres protestaient, il se moquait deux. Mais il devait faire
attention ne pas dpasser les limites, sinon il risquait dtre puni au cours
de la journe.
Une nuit, Maui imagina un tour jouer sa mre. Une fois tous les
autres endormis, il se releva et fit le tour de la maison. Partout o filtrait
la clart dune toile, il bouchait vite louverture et calfeutrait mme les
fentes des roseaux. Puis il droba le manteau, la ceinture et la couronne de
sa mre et les cacha.
Maui reprit alors sa place et dcida de rester veill. La longue nuit
passa lentement. Quand vint le matin, pas un rai de lumire ne put percer.
Bientt ce fut lheure. Dhabitude Maui pouvait distinguer les formes des
pieds de ses frres lautre bout de la maison, mais ce matin il faisait. Et sa
mre continuait dormir.
Au bout dun moment elle bougea et marmonna : " Quelle sorte de nuit
est donc-ce pour durer si longtemps ? Mais elle se rendormit.
Finalement elle se rveilla en sursaut et se mit chercher ses vtements.
elle arracha ce Maui que avait fourr. Mais ctait le jour ! Le grand jour !
Le soleil tait haut dj ! Elle s empara dun morceau de tapa et se sauva.
Sa mre partie, Maui bondit prs du store et regarda par louverture. Il
vit quelle tait dj loin. Puis elle sarrta, saisit un arbuste de tiare Tahiti,
le souleva : un trou apparut, elle sy engouffra et remit en place le buisson
comme avant.
Maui jaillit aussi vite quil put, escalada la pente abrupte, trbuchant
et tombant car il gardait les yeux fixs sur larbuste de tiare. Il latteignit
finalement, le souleva et dcouvrit une caverne.
Plus tard, tandis que ses frres taient trs affairs se baigner dans
le frais ruisseau et chercher un fruit de larbre pain se mettre sous
la dent, Maui les questionna : " croyez O que notre pre et notre mre
passent la journe-vous donc ?-" Comment le saurions-nous ? Et pourquoi
te tracasses-tu avec a ? Tu ne peux donc pas vivre tranquillement avec
nous ? Que nous importe notre pre ou notre mre ? Est quelle nous a levs avec de la bonne nourriture-ce ? Pas du du tout : elle tait toujours
partie. Peut-tre bien que le grand Taaroa est notre pre et quil a ses enfants envoy ici-bas ! Niu-Hiti ; Hau-Rii ; Hau-Roto-Roto ; Tou-Arii et son
frre. Taaroa a toute sa famille envoy. Ensuite Papa a germer ses graines
fait.-" Mais oui, bien sr ", leur rpondit le petit Maui, " tout ce vous que
dites est vrai. Cest mme encore plus pour moi que pour vous vrai. Vous,

Franois D UPRESSOIR - NSL - 31 aot 2006

35

Extrait dun conte polynsien

vous avez t nourris. Mais moi, mes frres, je nai jamais son sein tt, ni
rien mang. Et pourtant je laime, et cest parce que je laime que je souffre
de ne pas savoir o elle se trouve ."
Ses frres se sentirent surpris et charms. ils lapprouvrent et lencouragrent tenter de trouver leur pre et leur mre.
Maui ne se tint plus de joie. Il se mit tout de suite faire la magie. Il
allait devoir voyager vite et il dcida de se changer.
Il ne savait pas quel oiseau choisir. Il pensa bien sr au noha mais il le jugea
trop gros. Il se fit maho mais ses frres pensrent quil tait trop petit et pas
joli. Puis il devint otaha mais ils trouvrent cette crature aux ailes plus
longues que leurs bras effrayante. Alors il essaya un oiseau aprs lautre.
Enfin il se changea.

Franois D UPRESSOIR - NSL - 31 aot 2006

36

Bibliographie
[Abe93] Anne A BEILL : Les nouvelles syntaxes : grammaires dunification et analyse du
franais. Armand Colin, premire dition, 1993.
[Bre82]

Joan B RESNAN : The Mental representation of grammatical relations. MIT Press,


1982.

[Cha84] Jacques C HAUCH : Un outil multidimensionnel de lanalyse du discours.


In Proceedings of the 22nd annual meeting on Association for Computational Linguistics, pages 1115, Morristown, NJ, USA, 1984. Association for Computational Linguistics.
[Cha01] Jacques C HAUCH : SYGMART : manuel de rfrence. LICIA, 11 bis, rue
des Capucins. 92190 Meudon, 4.0 dition, avril 2001. http://www.lirmm.fr/
~chauche/REFERENCESYG/docsyg.html.
[Dod92] Edward D ODD : La Lgende de Maui / Maui peu tini. Haere Po, 1992.
[dSE43] Antoine de S AINT E XUPRY : Le Petit Prince. 1943.
[Gro75]

Maurice G ROSS : Mthode en syntaxe. Rgime des constructions compltives.


Hermann, premire dition, 1975.

[GT04]

Jolle G ARDES -TAMINE : La Grammaire, volume 2. Syntaxe. Armand Colin,


troisime dition, 2004.

[RPR04] Martin R IEGEL, Jean-Christophe P ELLAT et Ren R IOUL : Grammaire mthodique du franais. PUF, troisime dition, fvrier 2004. Deuxime tirage (juin
2005).
[Tom01] Roberte T OMASSONE : propos des complments circonstanciels . Les
revues pdagogiques de la Mission laque franaise Connaissance du franais, 43:
5964, novembre 2001.
[YMP05] Mehdi Y OUSFI -M ONOD et Violaine P RINCE : Utilisation de la structure
morpho-syntaxique des phrases dans le rsum automatique - compression
de phrases narratives. In TALN05 : 12me Confrence Internationale sur le Traitement Automatique du Langage Naturel, pages 193202, 2005.
[YMP06] Mehdi Y OUSFI -M ONOD et Violaine P RINCE : Compression de phrases par
lagage de leur arbre morpho-syntaxique. Technique et Science Informatiques,
25:437468, 2006.

Franois D UPRESSOIR - NSL - 31 aot 2006

37

You might also like