SATO 4.4, Manuel de référence (mars 2007) |
Table des matières | Définitions |
Dictionnaire séquentiel |
---|
... est un dictionnaire à champ unique en format compressé. Un tel dictionnaire permet d'associer des valeurs de propriété à des chaînes de caractères qui correspondent à des formes lexicales. |
Exploration :
Exploitation :
Librairie de dictionnaires Exemples : |
En plus des dictionnaires personnels de l'usager, divers dictionnaires peuvent faire partie d'une librairie commune. Normalement, ces dictionnaires sont manipulés par des scénarios communs. Il n'est donc pas conseillé de les appliquer directement. Voici une description des dictionnaires développés au Centre ATO pour l'annotation de lexiques en français.
AFFICHER est l'opération qui permet d'afficher à l'écran le contenu d'un dictionnaire.
Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».
Le filtre est un patron de fouille qui permet de définir les entrées du dictionnaire que l'on veut afficher. Sa valeur implicite est «$» (tous les mots).
La clé facultative DÉFINITION permet d'afficher la définition du champ en plus des valeurs.
Voir : Exemple 1 - Dictionnaire séquentiel afficher.APPLIQUER permet de consulter un dictionnaire et de transférer l'information qu'il contient dans une propriété lexicale déjà définie. La définition de la propriété doit être compatible avec celle du dictionnaire.
Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».
Le mot PROPRIÉTÉ suivi d'un nom de propriété désigne la propriété lexicale qui va recevoir les valeurs trouvées dans le dictionnaire.
Le paramètre filtre (valeur implicite «$») permet de sélectionner les entrées lexicales qui seront fouillées dans le dictionnaire.
Normalement, l'attribution de valeurs à une propriété à partir du dictionnaire se fait par remplacement de l'ancienne valeur. L'option AJOUTER indique que les valeurs trouvées seront plutôt ajoutées aux valeurs existantes. À l'inverse, l'option RETIRER indique que les valeurs trouvées seront retirées de la propriété (cf. Dictionnaire : Algorithme).
Voir : Exemple 2 - Dictionnaire séquentiel appliquer.L'action ATTRIBUER permet de créer un dictionnaire séquentiel, et de lui attribuer des valeurs, à partir d'une propriété lexicale. Le champ implicite défini dans le dictionnaire correspond à la définition de la propriété.
Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic». Un nom de fichier devrait être composé de lettres minuscules sans accents, de chiffres et des caractères «-» et «_». Il ne doit pas contenir d'espaces et ne doit pas débuter par «-».
Le mot PROPRIÉTÉ suivi d'un nom de propriété désigne la propriété lexicale dont les valeurs seront inscrites dans le dictionnaire.
Le paramètre filtre (valeur implicite «$») permet de sélectionner les entrées lexicales qui seront inscrites dans le dictionnaire.
Voir : Exemple 3 - Dictionnaire séquentiel attribuer.DÉCRIRE fournit une description du contenu du dictionnaire.
Le paramètre fichier désigne le nom du fichier dictionnaire. SATO assume que le fichier porte le suffixe «.dic».
DÉCRIRE fournit une description du contenu du dictionnaire. Le type de description fournie dépend du type de la propriété qui a servi à construire le dictionnaire. La description débute par la définition du champ. Un champ entier se traduit par le calcul de la moyenne et de l'écart type. Un champ symbolique entraîne le décompte de la fréquence absolue et relative de chaque symbole. Dans tous les cas la description se termine par le décompte du nombre d'entrées lues et trouvées.
Le filtre est un patron de fouille qui permet de définir les entrées du dictionnaire que l'on veut décrire. Sa valeur implicite est «$» (tous les mots).
EXPORTER permet d'enregistrer le contenu du dictionnaire sur le fichier de listage.
Voir : AFFICHER pour l'explication des paramètres et du fonctionnement de la commande.Exemple 1. Exemple d'affichage d'un dictionnaire séquentiel.
Les entrées du dictionnaire «..\lib\art.dic» débutant par «a» sont affichés. La définition du dictionnaire est également affichée.
DICTIONNAIRE SÉQUENTIEL AFFICHER ..\lib\art.dic a$ DEFINITION champ Art symbolique Artdéffp Artdéffs Artdéfmp Artdéfms Artindfp Artindfs Artindmp Artindms Artparfp Artparfs Artparmp Artparms au*Art=Artdéfms aux*Art=(Artdéffp,Artdéfmp) nombre d'entrées lues, trouvées, écrites: 10, 2, 0 |
Exemple 2. Exemple d'application d'un dictionnaire séquentiel.
On applique le dictionnaire «..\lib\gramr.dic» sur tous les mots du lexique dont la valeur de la propriété lexicale «gramr» est «nil», c'est-à-dire ne possédant pas de valeur pour cette propriété. Il faut noter que la propriété lexicale symbolique «gramr» doit avoir été créée au préalable. Deux résultats numériques sont présentés : le premier nombre indique le nombre de formes lexicales lues dans le dictionnaire tandis que le second donne le nombre de formes appartenant au lexique du texte et qui ont trouvé leur équivalent dans le dictionnaire. La commande LEXIQUE AFFICHER affiche le résultat pour les entrées débutant par «a».
DICTIONNAIRE SÉQUENTIEL APPLIQUER ..\lib\gramr.dic propriété Gramr POUR $*gramr=nil nombre d'entrées lues, trouvées, écrites: 299252, 162, 0 LEXIQUE AFFICHER a$ TRI Alphabet Fréqtot Gramr 1 (Vaux,Vconj) a 1 Vparpas alléché 1 Nomcom ambassadeurs 1 (Adjqua,Nomcom) animal 1 Vconj apprenez 1 Vconj approchez 1 Nomcom arbre 1 Adv assez 1 (Adv,Con) aussi 1 Artdéf aux 1 (Nomcom,Vinf) avoir Nombre de lexèmes écrits: 11 |
Exemple 3. Exemple d'attribution de valeurs à un dictionnaire séquentiel.
On peut définir un dictionnaire séquentiel à partir d'un lexique catégorisé. Dans l'exemple qui suit, on présume que l'on a défini une propriété lexicale «gramr» sur les fables de La Fontaine. Aussi, si l'on a attribué la valeur «Adjqua» aux adjectifs qualificatifs présents dans le lexique des fables, la commande suivante permettra de conserver cette catégorisation dans le dictionnaire séquentiel «adjectif.dic». La commande affichera quelques statistiques.
DICTIONNAIRE SÉQUENTIEL ATTRIBUER adjectif PROPRIÉTÉ gramr POUR $*gramr=Adjqua Nombre de formes lues, trouvées, écrites : 0, 0, 24 |