1 - La fréquence des mots

La Constitution espagnole comporte 16754 mots-occurrences (significatifs de la longueur du texte) et 2870 vocables (mots différents).
Le logiciel utilisé ne tient pas compte des accents.
Les 100 mots les plus fréquents apparaissent, dans un "nuage de mots clés", dans l'ordre alphabétique. Les mots grammaticaux (articles, prépositions, pronoms personnels, etc.) sont exclus du décompte.
La fréquence des mots est une première approche du texte.


2 - L'entourage des mots (les collocations) et les phraséologies (autres dénominations: les locutions, les lexies composées, les lexies complexes)

Voir les définitions

L'étape qui suit le simple aperçu de la fréquence des mots est celle de l'observation du comportement des mots dans leur contexte.

On utilise pour cela un concordancier

Concordances : liste ordonnée de termes extraits d'un texte, et accompagnés de la référence de chaque occurrence et d'une partie du contexte. (norme ISO 1087)
On utilise pour cela un concordancier.
Le concordancier AntConc (Anthony's Concordancer) est un freeware que vous pouvez télécharger à partir de Laurence Anthony's Homepage : AntConc.
Les mots apparaissent dans leur contexte immédiat, (un simple clic les resitue dans le texte d'origine), ce qui permet de vérifier par exemple pour les verbes, leur construction, et pour les noms, leur entourage lexical (utile pour repérer les termes et les phraséologies).