Enrichissement de structures en dépendances par réécriture de graphes

Nous présentons ici un extrait de 120 phrases du corpus arboré (French Treebank) de Paris 7 annoté en dépendances. Chaque phrase est présentée avec au-dessus en noir, l'arbre de dépendances et au dessous, les relations profondes qui sont ajoutées par notre système.

Remerciements

  • Merci à Anne Abeillé pour nous avoir autorisé à diffuser cet extrait du corpus.
  • Merci à Benoit Crabbé et Marie Candito pour nous avoir fourni les données.

Documents

Les phrases avec les nouvelles relations

Les 120 phrases sont accessibles en suivant les liens ci-dessous

(001-010) (011-020) (021-030) (031-040) (041-050) (051-060) (061-070) (071-080) (081-090) (091-100) (101-110) (111-120)

Les relations

Les relations ajoutées sont :

  • les sujets des infinitifs et des participes (présents et passés) : SUJP_V
  • les sujets des adjectifs : SUJP_A
  • les antécédents des pronoms relatifs : ANT_REL

En fait, notre système gère également d'autres types de liens qui sont présents dans le FTB mais pas dans l'extrait visible ici :

  • les objets d'infinitif dans la construction de type tough movment
  • les antécédents des pronoms réflexifs et des pronoms personnels sujets répétés

Exemples

Relations Nombre Exemples
SUJP_V 99 001 003 005 008 011 012 013 015 017 019
SUJP_A 233 001 002 003 004 006 008 011 014 015 020
ANT_REL 29 001 002 004 013 019 021 027 037 039 041

Système de réécriture