Adnotarea corpului de date cere selectarea unui format pentru reprezentarea textului şi a adnotărilor sale în formă electronică. Formatul dat trebuie să permită folosirea şi refolosirea corpului de date adnotat de programele soft disponibile în diferite locuri de cercetare. Limbajul extins de marcări (XML) asigură un cadru de codificări standarde pentru adnotări, care satisface aceste necesităţi.
Corpus annotation requires the choice of a format for representing the text and its annotations in electronic form. The format should enable maximum usability and reusability of the annotated corpus by software available at different research sites. The extended markup Language (XML) provides a standard encoding framework for annotation that answers these needs.
L’annotation d’un corpus de données demande choisir un format pour la représentation du texte et ses annotations en forme électronique. Le format doit permettre maximum d’utilisation et re-utilisation du corpus annoté pour le software disponible sur diférents sites de recherche. Le langage élargé de marquage (XML) assure un cadre de codifications standardes pour annotations, qui satisfait ces necessités.
Аннотация совокупности данных требует выбора формата для представления текста и его аннотаций в электронной форме. Формат должен допустить максимальной применимости и возможности многократного использования аннотируемой совокупности данных программным обеспечением, доступным в различных исследовательских центрах. Расширенный язык пометок (XML) обеспечивает ряд стандартных кодирований для аннотаций, который отвечает этим потребностям.