Édimbourg: Edinburgh University Press, 2006. Faire une concordance va mettre le mot au milieu et vous montrer à quoi ressemble le texte environnant. Les sont envoyés en code binaire, non traduit en ASCII, ce qui risquerait une perte d`information. De nombreux corpus ont été fournis avec une sorte d`information linguistique, ici appelée majoration ou annotation. Il contient des textes dans une seule langue. En outre, il existe une caractéristique diachronique spécialisée appelée Trends, qui identifie les mots dont l`utilisation change la plupart de la période de temps sélectionnée. Un certain alignement peut être fait automatiquement par le logiciel, bien que les meilleurs résultats soient généralement produits lorsqu`un utilisateur humain vérifie l`alignement automatique et corrige le cas échéant. Tagset: une collection de balises sous la forme d`un schéma pour annoter des corpus. Comment faire un corpus? Le corpus est utilisé pour étudier les erreurs et les problèmes que les apprenants ont lors de l`apprentissage d`une langue étrangère. Caractères génériques: un caractère spécial tel qu`un astérisque (*) ou un point d`interrogation (? Tout ce que vous devez faire maintenant est d`ouvrir le fichier dans Antconc et vous êtes prêt à avoir du plaisir. Avec lui, on peut utiliser un programme de concordance ou un concordancier pour analyser des fichiers de texte brut (extension «. Les deux langues doivent être alignées, i.

théoriquement, il n`y a rien à dire que notre corpus ne pouvait contenir que dix mots comme dans la phrase ci-dessus. Tabulation croisée: tableau montrant les fréquences de chaque variable dans chaque échantillon co-texte un terme plus précis que le contexte ou le contexte verbal utilisé pour désigner les mots de chaque côté d`un mot ou d`une phrase sélectionnée. Anaphora: pronoms, phrases nominales, etc. Il existe un certain nombre de différents programmes et moteurs de recherche disponibles pour une utilisation avec les corpus, et certains sont présentés sur la page «outils» (à ajouter). Représentativité: on pense qu`un corpus est représentatif de la variété linguistique qu`il est supposé représenter si les constatations fondées sur son contenu peuvent être généralisées à ladite variété de langues de récupération un terme utilisé pour désigner la possibilité pour l`utilisateur de récupérer le texte original de base à partir de n`importe quel texte qui a été annotée avec plus d`informations.