La fréquence et l'entourage des mots dans la Constitution espagnole
Par IniTerm le samedi 26 février 2011, 17:31 - Le GREJA - Lien permanent
Exemple: la Constitution espagnole de 1978
Il existe des outils informatiques pour étudier le vocabulaire d'un texte. Le premier outil est le "nuage de mots-clés", bien connu des internautes. C'est une première photographie du texte, qui indique les fréquences des mots en faisant ressortir ceux qui sont le plus employés (on peut demander par exemple les 100 mots les plus employés)
Le deuxième outil se nomme concordancier et montre l'entourage des mots.
Exemple de nuage de mots-clés: voir les 100 mots les plus fréquents dans la Constitution espagnole de 1978
1 - La fréquence des mots
La Constitution espagnole comporte 16754 mots-occurrences (significatifs de la longueur du texte) et 2870 vocables (mots différents).
Le logiciel utilisé ne tient pas compte des accents.
Les 100 mots les plus fréquents apparaissent, dans un "nuage de mots clés", dans l'ordre alphabétique. Les mots grammaticaux (articles, prépositions, pronoms personnels, etc.) sont exclus du décompte.
La fréquence des mots est une première approche du texte.
2 - L'entourage des mots (les collocations) et les phraséologies (autres dénominations: les locutions, les lexies composées, les lexies complexes)
L'étape qui suit le simple aperçu de la fréquence des mots est celle de l'observation du comportement des mots dans leur contexte.
On utilise pour cela un concordancier
Concordances : liste ordonnée de termes extraits d'un texte, et accompagnés de la référence de chaque occurrence et d'une partie du contexte. (norme ISO 1087)
On utilise pour cela un concordancier.
Le concordancier AntConc (Anthony's Concordancer) est un freeware que vous pouvez télécharger à partir de Laurence Anthony's Homepage : AntConc.
Les mots apparaissent dans leur contexte immédiat, (un simple clic les resitue dans le texte d'origine), ce qui permet de vérifier par exemple pour les verbes, leur construction, et pour les noms, leur entourage lexical (utile pour repérer les termes et les phraséologies).