ORTOLANG Dépôt et diffusion

Banque de données parole et langage (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Archives ouvertes (OAI-PMH)

Les données de cet objet sont désormais également disponibles sur la nouvelle plateforme Ortolang.
Identifiant pérenne: hdl:11041/ortolang-000903
Corpus ANCOR Centre
Jean-Yves Antoine, LI
Laboratoire d‘Informatique (LI, Tours FR)
Laboratoire Ligérien de Linguistique (LLL, Orléans FR)
Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)

Identifiant pérenne: hdl:11041/ortolang-000903
SLDR/ORTOLANG id: http://sldr.org/ortolang-000903
OAI: oai:sldr.org:ortolang-000903 (olac - oai_dc - VLO - language-archives)
(Diverses publications)


Travaux en cours : - réalisation d’une version compatible TEI
- réalisation d’une version avec annotation déportée Glozz en chaînes de coréférences
- réalisation d’une version avec annotation déportée en cluster de mentions coréférentes

 [Discussion]
 
Type d'objet Données secondaires (ressource)
Identifiant ortolang-000903 (version 1/1)
Statutdonnées source
Table des matières
(Détails)
 
Vitrine
DescriptionANCOR Centre est un corpus francophone d’envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L’annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l’objet de cette distribution.
Référence bibliographique FR: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Données secondaires (ressource). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Création 2014-10-30. Banque de données parole et langage (SLDR/ORTOLANG). Identifiant hdl:11041/ortolang-000903
EN: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Secondary data (resource). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Created 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). Identifier hdl:11041/ortolang-000903
ES: Corpus ANCOR Centre (Jean-Yves Antoine, LI). Datos secundarios (recurso). Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Creación 2014-10-30. Banco de datos de habla y lenguaje (SLDR/ORTOLANG). Identificador hdl:11041/ortolang-000903
ZH: Corpus ANCOR Centre (Jean-Yves Antoine, LI). 资源. Laboratoire d‘Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). 创建 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). 标识符 hdl:11041/ortolang-000903
Autorisations d'accès
(voir documentation)
toute personne inscrite au SLDR/ORTOLANG
Liste des langues concernées par cet objetfrançais
Discipline(s) linguistique(s)computational_linguistics <-- sldr000890 Accueil_UBS
text_and_corpus_linguistics <-- sldr000890 Accueil_UBS
speech_prosody <-- sldr000890 Accueil_UBS
general_linguistics <-- sldr000831 OTG
Catégorie de ressourceenrichissements
Contact au SLDR/ORTOLANG
  Jean-Yves ANTOINE
Lien vers la page wikihttp://sldr.org/wiki/sldr000903
Mots-clefscoréférence, anaphore, parole spontanée
Lien(s) complétant la descriptionhttp://www.info.univ-tours.fr/~antoine/parole_publique/ANCOR_Centre/index.html
Historique des versions1.0 version avec annotation déportée des coréférences au format Glozz et pointage des relations de coréférence sur la première mention (LI & LLL)
1.1 version avec ajout d’une version intégrée des annotations en chaînes de coréférence
Extensions spécifiques des fichiers texteaa, ac, aam
Communauté d'utilisateurssldr.org/ortolang-000903/com
Relations
(voir documentation)
isRequiredBy http://eslo.huma-num.fr
isRequiredBy données primaires (corpus) sldr000890 Accueil_UBS
isRequiredBy données primaires (corpus) sldr000831 OTG
description http://hal.archives-ouvertes.fr/hal-01075679
description http://www.taln2013.org/actes/www/TALN-2013/a...
description https://hal.archives-ouvertes.fr/hal-01016562...
Taille de cet objet488 000 mots

290 Mb
1409 fichiers
Plus grand fichier : 12.29 Mb
Publication(s) de référence[115] MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland.
http://hal.archives-ouvertes.fr/hal-01075679
[116] Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562].
http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf
https://hal.archives-ouvertes.fr/hal-01016562
Publication(s) basées sur cet objetDiverses publications
Origine spatiale des données (code du pays 2 caractères)FR
Rôles
(voir documentation)
depositor: Pr Jean-Yves Antoine, LI
annotator: Mme Aurore Boyer-Pelletier, LLL
developer: Mme Adèle Desoyer, LATTICE
researcher: Dr Iris Eskhol, LLL
researcher: Dr Frederic Landragin, LATTICE
researcher: Dr Anaïs Lefeuvre, LI
researcher: Pr Denis Maurel, LI
annotator: Mme Judith Muzerelle, LLL
researcher: Dr Emmanuel Schang, LLL
researcher: Pr Isabelle Tellier, LATTICE
researcher: Dr Jeanne Villaneau, IRISA
Catégorie de dérogation au principe de libre communicabilité des archives publiques (voir documentation)AR038 - Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)
Compatibilité avec la législation actuelle sur les archives publiques100%
OLAC [masquer]<oai:record>
<oai:header>
<oai:identifier>oai:sldr.org:ortolang-000903</oai:identifier>
<oai:datestamp>2017-11-19</oai:datestamp>
</oai:header>
<oai:metadata><olac:olac>
<dc:title xml:lang="fr">Corpus ANCOR Centre</dc:title>
<dcterms:bibliographicCitation xml:lang="en">Corpus ANCOR Centre (Jean-Yves Antoine, LI). Secondary data (resource). Laboratoire d'Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Created 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). Identifier hdl:11041/ortolang-000903</dcterms:bibliographicCitation>
<dcterms:bibliographicCitation xml:lang="es">Corpus ANCOR Centre (Jean-Yves Antoine, LI). Datos secundarios (recurso). Laboratoire d'Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Creación 2014-10-30. Banco de datos de habla y lenguaje (SLDR/ORTOLANG). Identificador hdl:11041/ortolang-000903</dcterms:bibliographicCitation>
<dcterms:bibliographicCitation xml:lang="fr">Corpus ANCOR Centre (Jean-Yves Antoine, LI). Données secondaires (ressource). Laboratoire d'Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). Création 2014-10-30. Banque de données parole et langage (SLDR/ORTOLANG). Identifiant hdl:11041/ortolang-000903</dcterms:bibliographicCitation>
<dcterms:bibliographicCitation xml:lang="zh">Corpus ANCOR Centre (Jean-Yves Antoine, LI). 资源. Laboratoire d'Informatique (LI, Tours FR), Laboratoire Ligérien de Linguistique (LLL, Orléans FR), Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR). 创建 2014-10-30. Speech and Language Data Repository (SLDR/ORTOLANG). 标识符 hdl:11041/ortolang-000903</dcterms:bibliographicCitation>
<dc:publisher>Laboratoire d'Informatique (LI, Tours FR)</dc:publisher>
<dcterms:provenance>Laboratoire d'Informatique (LI, Tours FR)</dcterms:provenance>
<dc:publisher xsi:type="dcterms:URI">http://www.li.univ-tours.fr</dc:publisher>
<dcterms:provenance xsi:type="dcterms:URI">http://www.li.univ-tours.fr</dcterms:provenance>
<dc:publisher>Laboratoire Ligérien de Linguistique (LLL, Orléans FR)</dc:publisher>
<dcterms:provenance>Laboratoire Ligérien de Linguistique (LLL, Orléans FR)</dcterms:provenance>
<dc:publisher xsi:type="dcterms:URI">http://www.lll.cnrs.fr</dc:publisher>
<dcterms:provenance xsi:type="dcterms:URI">http://www.lll.cnrs.fr</dcterms:provenance>
<dc:publisher>Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)</dc:publisher>
<dcterms:provenance>Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)</dcterms:provenance>
<dc:publisher xsi:type="dcterms:URI">http://www.lattice.cnrs.fr</dc:publisher>
<dcterms:provenance xsi:type="dcterms:URI">http://www.lattice.cnrs.fr</dcterms:provenance>
<dc:contributor xsi:type="olac:role" olac:code="annotator">Boyer-Pelletier, Aurore Ms, LLL</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="annotator">Muzerelle, Judith Ms, LLL</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="developer">Desoyer, Adèle Ms, LATTICE</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Lefeuvre, Anaïs Dr, LI</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Schang, Emmanuel Dr, LLL</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Tellier, Isabelle Pr, LATTICE</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Landragin, Frederic Dr, LATTICE</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Eskhol, Iris Dr, LLL</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Maurel, Denis Pr, LI</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="researcher">Villaneau, Jeanne Dr, IRISA</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="depositor">Antoine, Jean-Yves Pr, LI</dc:contributor>
<dc:creator>Antoine, Jean-Yves Pr, LI</dc:creator>
<dc:contributor xsi:type="olac:role" olac:code="depositor">Laboratoire d'Informatique (LI, Tours FR)</dc:contributor>
<dc:contributor xsi:type="dcterms:URI">http://www.li.univ-tours.fr</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="depositor">Laboratoire Ligérien de Linguistique (LLL, Orléans FR)</dc:contributor>
<dc:contributor xsi:type="dcterms:URI">http://www.lll.cnrs.fr</dc:contributor>
<dc:contributor xsi:type="olac:role" olac:code="depositor">Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)</dc:contributor>
<dc:contributor xsi:type="dcterms:URI">http://www.lattice.cnrs.fr</dc:contributor>
<dc:type>info:eu-repo/semantics/dataset</dc:type>
<dc:rights>info:eu-repo/date/submitted/2014-10-30</dc:rights>
<dcterms:license xsi:type="dcterms:URI">http://creativecommons.org/licenses/by-nc-sa/4.0/</dcterms:license>
<dcterms:accessRights xml:lang="en">Free access under Attribution-NonCommercial-ShareAlike 4.0 International License</dcterms:accessRights>
<dc:rights>info:eu-repo/semantics/openAccess</dc:rights>
<dcterms:provenance xml:lang="en">source data</dcterms:provenance>
<dcterms:provenance xml:lang="es">datos de origen</dcterms:provenance>
<dcterms:provenance xml:lang="fr">données source</dcterms:provenance>
<dcterms:provenance xml:lang="zh">源数据</dcterms:provenance>
<dcterms:accessRights xml:lang="fr">Documents librement communicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)</dcterms:accessRights>
<dcterms:accessRights xml:lang="en">Documents freely communicated. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1)</dcterms:accessRights>
<dcterms:accessRights xml:lang="zh">自由地被传达的文件 (Code du Patrimoine, 艺术。L. 211-1, L. 211-4, L. 213-1)</dcterms:accessRights>
<dcterms:accessRights xml:lang="es">Documentos libremente comunicables. (Code du Patrimoine, art. L. 211-1, L. 211-4, L. 213-1) </dcterms:accessRights>
<dcterms:extent>290370739</dcterms:extent>
<dcterms:spatial xsi:type="dcterms:ISO3166">FR</dcterms:spatial>
<dc:subject xsi:type="olac:linguistic-field" olac:code="computational_linguistics"/>
<dc:subject xsi:type="olac:linguistic-field" olac:code="text_and_corpus_linguistics"/>
<dc:subject xsi:type="olac:linguistic-field" olac:code="general_linguistics"/>
<dc:subject xml:lang="en">coreference</dc:subject>
<dc:subject xml:lang="en">anaphora</dc:subject>
<dc:subject xml:lang="en">conversational speech</dc:subject>
<dc:subject xml:lang="fr">coréférence</dc:subject>
<dc:subject xml:lang="fr">anaphore</dc:subject>
<dc:subject xml:lang="fr">parole spontanée</dc:subject>
<dc:language xsi:type="olac:language" olac:code="fra"></dc:language>
<dc:language xsi:type="olac:language" olac:code="fra" xml:lang="en">French</dc:language>
<dc:language xsi:type="olac:language" olac:code="fra" xml:lang="es">Francés</dc:language>
<dc:language xsi:type="olac:language" olac:code="fra" xml:lang="fr">français</dc:language>
<dc:language xsi:type="olac:language" olac:code="fra" xml:lang="zh">法语</dc:language>
<dc:description xml:lang="en">ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence</dc:description>
<dc:description xml:lang="fr">ANCOR Centre est un corpus francophone d'envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L'annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative Commons CC-BY-SA pour ce qui est des données concernant les corpus OTG, Accueil_UBS et CO2, et sous licence CC-BY-SA-NC pour le corpus lié à ESLO. Les sources audio (diffusées librement par ailleurs) liées à ce corpus ne font pas l'objet de cette distribution.</dc:description>
<dcterms:isRequiredBy xsi:type="dcterms:URI">http://eslo.huma-num.fr</dcterms:isRequiredBy>
<dcterms:isRequiredBy xsi:type="dcterms:URI">http://hdl.handle.net/11041/sldr000890</dcterms:isRequiredBy>
<dcterms:isRequiredBy xsi:type="dcterms:URI">http://hdl.handle.net/11041/sldr000831</dcterms:isRequiredBy>
<dc:description>MUZERELLE, J.; LEFEUVRE, A.; SCHANG, E.; ANTOINE, J.-Y; PELLETIER, A.; MAUREL, D.; ESHKOL, I.; VILLANEAU, J. (2014). ANCOR_Centre, a Large Free Spoken French Coreference Corpus: description of the Resource and Reliability Measures. LREC'2014, 9th Language Resources and Evaluation Conference., May 2014, Reyjavik, Iceland.</dc:description>
<dc:description xsi:type="dcterms:URI">http://hal.archives-ouvertes.fr/hal-01075679</dc:description>
<dc:description>Judith MUZERELLE, Anaïs LEFEUVRE, Jean-Yves ANTOINE, Emmanuel SCHANG, Denis MAUREL, Jeanne VILLANEAU, Iris ESHKOL (2013). ANCOR : premier corpus de français parlé d'envergure annoté en coréférence et distribué librement. Actes TALN'2013. Les Sables d'Olonnes, France [HAL 01016562].</dc:description>
<dc:description xsi:type="dcterms:URI">http://www.taln2013.org/actes/www/TALN-2013/actes/taln-2013-court-007.pdf</dc:description>
<dc:description xsi:type="dcterms:URI">https://hal.archives-ouvertes.fr/hal-01016562</dc:description>
<dcterms:tableOfContents>VERSION HISTORY:<br />1.0 version avec annotation déportée des coréférences au format Glozz et pointage des relations de coréférence sur la première mention (LI & LLL)<br />1.1 version avec ajout d'une version intégrée des annotations en chaînes de coréférence</dcterms:tableOfContents>
<dcterms:tableOfContents>Work in progress: - réalisation d'une version compatible TEI<br />- réalisation d'une version avec annotation déportée Glozz en chaînes de coréférences<br />- réalisation d'une version avec annotation déportée en cluster de mentions coréférentes</dcterms:tableOfContents>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://sldr.org/logo/LogoOrtolang_small.png</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903?urlappend=/toc</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903/Pres_ANCOR_Centre.pdf</dc:identifier>
<dc:format xsi:type="dcterms:IMT">application/pdf</dc:format>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903/CreativeCommons.html</dc:identifier>
<dc:format xsi:type="dcterms:IMT">text/plain</dc:format>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903/oai_dc.xml</dc:identifier>
<dc:format xsi:type="dcterms:IMT">application/xml</dc:format>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903/olac.xml</dc:identifier>
<dc:format xsi:type="dcterms:IMT">application/xml</dc:format>
<dc:identifier xsi:type="dcterms:URI">http://hdl.handle.net/11041/ortolang-000903/rdf.html</dc:identifier>
<dc:format xsi:type="dcterms:IMT">application/xml</dc:format>
<dc:date xsi:type="dcterms:W3CDTF">2014-10-26</dc:date>
<dcterms:created xsi:type="dcterms:W3CDTF">2014-10-30</dcterms:created>
<dcterms:modified xsi:type="dcterms:W3CDTF">2014-10-26</dcterms:modified>
<dc:type xsi:type="dcterms:DCMIType">Dataset</dc:type>
<dc:format>annotations</dc:format>
</olac:olac>
</oai:metadata>
</oai:record>

SIP (DocDC + DocMeta)Afficher le code
Date du premier dépôt2014-10-30
Date de la dernière modification de cet objet2014-10-26

Discussion

(Utilisateurs identifiés)

Ce site a fait l’objet d’une déclaration (No 1222972) le 26 mars 2008 à la Commission Nationale de l’Informatique et des Libertés (CNIL). Conformément à la législation française, toute personne citée nominativement dispose d’un droit d’accès, de modification, de rectification et de suppression des données qui la concernent (art. 34 de la loi « Informatique et Libertés » du 6 janvier 1978). Pour exercer ce droit, envoyez un message à webmaster(arobase)sldr.org.

[retour]