ORTOLANG Dépôt et diffusion

Banque de données parole et langage (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Archives ouvertes (OAI-PMH)

Les données de cet objet sont désormais également disponibles sur la nouvelle plateforme Ortolang.
Identifiant pérenne: hdl:11041/ortolang-000903
Corpus ANCOR Centre
Jean-Yves Antoine, LI
Laboratoire d‘Informatique (LI, Tours FR)
Laboratoire Ligérien de Linguistique (LLL, Orléans FR)
Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)

Identifiant pérenne: hdl:11041/ortolang-000903
SLDR/ORTOLANG id: http://sldr.org/ortolang-000903
OAI: oai:sldr.org:ortolang-000903 (olac - oai_dc - VLO - language-archives)
(Diverses publications)


Travaux en cours : - réalisation d’une version compatible TEI
- réalisation d’une version avec annotation déportée Glozz en chaînes de coréférences
- réalisation d’une version avec annotation déportée en cluster de mentions coréférentes

 [Discussion]
 
Type d'objet Données secondaires (ressource)
Identifiant ortolang-000903 (version 1/1)
Statutdonnées source

'Zip/tar' files may be downloaded in replacement for the set of files in directories listed on their tops.
Los ficheros 'zip/tar' permiten cargar de un golpe el conjunto de los ficheros puestos en una lista en el repertorio que precede.
Les fichiers 'zip/tar' permettent de télécharger en une seule fois l'ensemble des fichiers listés dans le répertoire qui précède.

Vitrine
DescriptionANCOR Centre est un corpus francophone d’envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L’annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l’objet de cette distribution.
Référence bibliographique FR: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Données secondaires (ressource). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Création 2014-10-30. Banque de données parole et langage (SLDR/ORTOLANG). Identifiant hdl:11041/ortolang-000903
EN: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Secondary data (resource). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Created 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). Identifier hdl:11041/ortolang-000903
ES: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Datos secundarios (recurso). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Creación 2014-10-30. Banco de datos de habla y lenguaje (SLDR/ORTOLANG). Identificador hdl:11041/ortolang-000903
ZH: Corpus ANCOR Centre (Jean-Yves Antoine, LI). 资源. Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). 创建 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). 标识符 hdl:11041/ortolang-000903
Autorisations d'accès
(voir documentation)
toute personne inscrite au SLDR/ORTOLANG
Liste des langues concernées par cet objetfrançais
Discipline(s) linguistique(s)computational_linguistics <-- sldr000890 Accueil_UBS
text_and_corpus_linguistics <-- sldr000890 Accueil_UBS
speech_prosody <-- sldr000890 Accueil_UBS
general_linguistics <-- sldr000831 OTG
Catégorie de ressourceenrichissements
Contact au SLDR/ORTOLANG
  Jean-Yves ANTOINE
Lien vers la page wikihttp://sldr.org/wiki/sldr000903
Mots-clefscoréférence, anaphore, parole spontanée
Lien(s) complétant la descriptionhttp://www.info.univ-tours.fr/~antoine/parole_publique/ANCOR_Centre/index.html
Historique des versions1.0 version avec annotation déportée des coréférences au format Glozz et pointage des relations de coréférence sur la première mention (LI & LLL)
1.1 version avec ajout d’une version intégrée des annotations en chaînes de coréférence
Extensions spécifiques des fichiers texteaa, ac, aam
Communauté d'utilisateurssldr.org/ortolang-000903/com
Relations
(voir documentation)
isRequiredBy http://eslo.huma-num.fr
isRequiredBy données primaires (corpus) sldr000890 Accueil_UBS
isRequiredBy données primaires (corpus) sldr000831 OTG
description http://hal.archives-ouvertes.fr/hal-01075679
description http://www.taln2013.org/actes/www/TALN-2013/a...
description https://hal.archives-ouvertes.fr/hal-01016562...
Taille de cet objet488 000 mots

290 Mb
1409 fichiers
Plus grand fichier : 12.29 Mb
Publication(s) de référence[115] MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland.
http://hal.archives-ouvertes.fr/hal-01075679
[116] Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562].
http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf
https://hal.archives-ouvertes.fr/hal-01016562
Publication(s) basées sur cet objetDiverses publications
Origine spatiale des données (code du pays 2 caractères)FR
Rôles
(voir documentation)
depositor: Pr Jean-Yves Antoine, LI
annotator: Mme Aurore Boyer-Pelletier, LLL
developer: Mme Adèle Desoyer, LATTICE
researcher: Dr Iris Eskhol, LLL
researcher: Dr Frederic Landragin, LATTICE
researcher: Dr Anaïs Lefeuvre, LI
researcher: Pr Denis Maurel, LI
annotator: Mme Judith Muzerelle, LLL
researcher: Dr Emmanuel Schang, LLL
researcher: Pr Isabelle Tellier, LATTICE
researcher: Dr Jeanne Villaneau, IRISA
Catégorie de dérogation au principe de libre communicabilité des archives publiques (voir documentation)AR038 - Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)
Compatibilité avec la législation actuelle sur les archives publiques100%
OLACAfficher le code
SIP (DocDC + DocMeta)Afficher le code
Date du premier dépôt2014-10-30
Date de la dernière modification de cet objet2014-10-26

Discussion

(Utilisateurs identifiés)

Ce site a fait l’objet d’une déclaration (No 1222972) le 26 mars 2008 à la Commission Nationale de l’Informatique et des Libertés (CNIL). Conformément à la législation française, toute personne citée nominativement dispose d’un droit d’accès, de modification, de rectification et de suppression des données qui la concernent (art. 34 de la loi « Informatique et Libertés » du 6 janvier 1978). Pour exercer ce droit, envoyez un message à webmaster(arobase)sldr.org.

Bookmark and Share
[retour]