ORTOLANG Dépôt et diffusion

Banque de données parole et langage (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Archives ouvertes (OAI-PMH)

Lost in migration ? Ce document peut vous aider : infoMigration-fr_0.2.pdf

Les nouveaux dépôts et les nouvelles inscriptions s'effectuent désormais sur la plateforme Ortolang.

Objets visibles : 342
Documents : 790860
Téléchargements : 26571
Utilisateurs : 658 (54 pays)
Langues parlées : 175

Dépôt et diffusion de données linguistiques orales et multimodales

A compter du 01/12/2015, le dépôt de données sur le SLDR seront suspendus afin de permettre l'ouverture au public de la plateforme Ortolang.

Désormais engagé avec le CNRTL et le Centre Nanterre-Orléans dans la construction de ORTOLANG, le SLDR poursuit son action de collecte et de partage des données linguistiques. L’ensemble des services actuellement proposés demeure et sera intégré à la nouvelle plateforme.

SLDR/ORTOLANG vous permet ainsi de parcourir les données déjà collectées dans le domaine de la linguistique orale/multimodale. Elles sont regroupées en quatre grands types d’objets : données primaires, données secondaires, outils et collections. Leur téléchargement est possible en fonction des différentes dispositions du droit des archives et du droit de la propriété intellectuelle.

Après identification sur le site, vous pouvez également effectuer le dépôt de vos données et créer leur notice descriptive via une interface dédiée. Celle-ci vous permet notamment de spécifier les droits d’accès aux données en fonction de leur statut, de leur nature, ou bien des catégories d’utilisateurs.

Les notices descriptives ainsi créées sont conformes aux principaux standards de métadonnées : elles sont donc accessibles pour les répertoires internationaux et les moteurs de recherche. Parallèlement, les données elles-mêmes reçoivent un identifiant pérenne permettant de les retrouver indépendamment de leur localisation.

Ces différentes étapes ont enfin vocation à préparer les objets en vue de leur archivage pérenne par le CINES, site d’archivage institutionnel.

N’hésitez pas à nous contacter pour toute information supplémentaire, ou consultez nos règles de bonne pratique pour la mutualisation et l'archivage des ressources linguistiques.

Recherche avancée

Les dépôts les plus récents (169) >> pluspage 1  >>
Données primaires (corpus) ortolang-000939
SITAF (tandems anglais/français) (Céline HORGUES)
Dépôt personnel

Corpus vidéo d’interactions tandem entre des étudiant-e-s francophones étudiant-e-s anglophones à l’Université Sorbonne Nouvelle- Paris 3. Chacune des 21 paires tandem réalise les tâches de production orale collaborative (narration, argumentation, lecture) à deux occasions (sessions d’enregistrements) espacées de 3 mois. Le corpus comprend aussi des interactions contrôle L1-L1 pour [...]


(applied_linguistics, language_acquisition, phonetics)
français; anglais
hdl:11041/ortolang-000939
2015-09-30
Version 1
données source
(Diverses publications)
Données primaires (corpus) blri-000940
Projet Noms Verbes (MEG) (ALARIO François-Xavier, LPC, BADIER Jean-Michel, INS, STRIJKERS Kristof, LPC, CHANOINE Valérie, BLRI)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)
Institut de Neurosciences des Systèmes (INS, Marseille FR)

Response preparation and encoding in word production. Tester des modèles actuels (2011-12-13) de la production de mots, ancrés dans la psycholinguistique, le contrôle moteur et les neurosciences.


(cognitive_science, neurolinguistics, psycholinguistics)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000940
2015-09-30
Version 1
données source
• BLRI
Données primaires (corpus) blri-000941
Projet Neuroling (IRMf) (FRENCK-MESTRE Cheryl, LPL, ANTON Jean-Luc, INT, BARKAT Mélissa, Praxiling, DJOURI Rym)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Institut des Neurosciences de la Timone (INT, Marseille FR)
Praxiling - UMR 5267 (Montpellier FR)

Reconnaissance de la langue arabe.


(cognitive_science, neurolinguistics)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000941
2015-09-30
Version 1
données source
• BLRI
Données primaires (corpus) blri-000942
Projet Intermod (IRMf) (Pattamadilok Chotiga, LPL, ZIEGLER Johannes, LPC, BELIN Pascal, INT, CHANOINE Valérie, BLRI)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)
Institut des Neurosciences de la Timone (INT, Marseille FR)

Rôle de la conscience et des processus top-down sur la contribution du cortex auditif pendant la lecture.


(neurolinguistics, cognitive_science)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000942
2015-09-30
Version 1
données source
• BLRI
Données primaires (corpus) blri-000943
Projet anti-tabac (IRMf) (SORIANO Alice, LPC, OULLIER Olivier, LPC)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)

Effet des avertissements sanitaires combinés anti-tabac sur l’activité cérébrale évoquée par des stimuli liés au tabac ou « smoking cue reactivity ».


(cognitive_science)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000943
2015-09-30
Version 1
données source
• BLRI
Données primaires (corpus) ortolang-000937
Methodology and software for Semi-Automatic multi-domain annotations: annotating, exploring and sharing data (Grégoire MOREAU DE MONTCHEUIL)
Dépôt personnel

A tutorial that presents how to collect a large set of annotations of various domains: phonetic (words, syllables, phonemes), prosody (Momel and INTSINT), syntax (categories, groups), self-repetitions and gestures. It shows that, with good practices, it is possible to merge such annotations in a single representation for sharing and exploring in an efficient way.


(applied_linguistics, computational_linguistics, text_and_corpus_linguistics)
anglais (English)
hdl:11041/ortolang-000937
2015-09-14
Version 1
données source

This material is Open Data
Données primaires (corpus) ortolang-000934
Corpus ese’eja (Marine VUILLERMET)
Dynamique du langage - UMR 5596 (DDL, Lyon FR)

Le présent corpus a été enregistré entre 2005 et 2013, et a été financé par plusieurs institutions dont Endangered Language Documentation Programme (2007), Afrique Amérique Latine Langues En Danger (ANR AALLED, 2008-2009) et Endangered Language Fund (2008). L’ese eja est une langue parlée par environ 1700 locuteurs en Amazonie bolivienne et péruvienne. Les enregistrements ont été essentiellement [...]


(language_documentation, sociolinguistics, anthropological_linguistics)
ese'eja
hdl:11041/ortolang-000934
2015-07-09
Version 1
données source
Google earth
OpenStreetMap
• Endangered Language Fund
• Endangered Language Documentation Programme
• ANR AALLED Afrique Amérique Latine Langues En Danger
Données secondaires (ressource) prax000929
Corpus St-Maur (documents) (Praxiling - UMR 5267 (Montpellier FR))
Praxiling - UMR 5267 (Montpellier FR)

Documents et travaux portant sur le corpus “Corpus St-Maur“


(applied_linguistics, anthropological_linguistics)
français
hdl:11041/prax000929
2015-06-29
Version 1
données source
Collection prax000930
GypsyLang
Praxiling - UMR 5267 (Montpellier FR)

Le présent corpus « Paroles de locuteurs gitans et non gitans sur trois générations à Perpignan » a été recueilli entre septembre 2013 et juin 2014. Il est issu d’une recherche financée par un fonds social européen (FSE) en partenariat avec l’Education Nationale, la Direction de l’Action Éducative et de l’Enfance de la Ville de Perpignan, afin de mieux comprendre les mécanismes [...]


(sociolinguistics, language_acquisition, anthropological_linguistics)
hdl:11041/prax000930
2015-06-29
Version 1
données source
Données primaires (corpus) prax000931
GypsyLang (corpus) (Praxiling - UMR 5267 (Montpellier FR))
Praxiling - UMR 5267 (Montpellier FR)

Données primaires du corpus “GypsyLang“


(anthropological_linguistics, sociolinguistics, language_acquisition)
nord-catalan (roussillonnais)
hdl:11041/prax000931
2015-06-29
Version 1
données source
Données secondaires (ressource) prax000932
GypsyLang (documents) (Praxiling - UMR 5267 (Montpellier FR))
Praxiling - UMR 5267 (Montpellier FR)

Documents et travaux portant sur le corpus “GypsyLang“


(sociolinguistics, language_acquisition, anthropological_linguistics)
hdl:11041/prax000932
2015-06-29
Version 1
données source
Données secondaires (ressource) prax000933
GypsyLang (transcriptions) (Praxiling - UMR 5267 (Montpellier FR))
Praxiling - UMR 5267 (Montpellier FR)

Transcriptions du corpus “GypsyLang“


(sociolinguistics, language_acquisition, anthropological_linguistics)
catalan -> nord-catalan (roussillonnais)
hdl:11041/prax000933
2015-06-29
Version 1
données source
Collection prax000928
Corpus St-Maur
Praxiling - UMR 5267 (Montpellier FR)

Le “Corpus Saint-Maur“ a été recueilli de Mai 2008 à juin 2009 dans le cadre du travail doctoral « Interactions et pratiques d’un processus d’innovation pédagogique en environnement carcéral » (Alidières 2013).

Il est constitué d’enregistrements audiovisuels portant, d’une part, sur les activités dans l’espace informatique de la Maison d’Arrêt et, d’autre [...]


(applied_linguistics, anthropological_linguistics)
français
hdl:11041/prax000928
2015-06-25
Version 1
données source
Données primaires (corpus) ortolang-000926
CREAGEST - Dialogue entre adultes sourds (Structures formelles du langage - UMR 7023 (SFL, Paris FR), Savoirs, textes et langage - UMR 8163 (STL, Lille FR), Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR))
Structures formelles du langage - UMR 7023 (SFL, Paris FR)
Savoirs, textes et langage - UMR 8163 (STL, Lille FR)
Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR)

Il s’agit d’un corpus de dialogues entre adultes sourds (106 heures) : 51 entretiens, animés par quatre enquêteurs sourds de quatre régions de France différentes (entretiens semi-directifs, 3 caméras).

Les vidéos mises à disposition ici constituent une sous-partie du corpus global : 7 extraits filmés avec trois caméras (soit 21 fichiers).


(discourse_analysis, sociolinguistics, language_acquisition)
(Non classifié)

>> Collection CREAGEST ortolang-000912
picto
hdl:11041/ortolang-000926
2015-06-11
Version 1
données source
• ANR CREAGEST (2008-2012)

This material is Open Data
Collection ortolang-000922
ACORFORMed

Corpus de formation des médecins à l’annonce d’événements indésirables graves.
Deux sources du corpus : l’Institut Paoli-Calmettes de Marseille et le CHU d’Angers.


(discourse_analysis)
picto picto2
hdl:11041/ortolang-000922
2015-05-21
Version 1
données source
• CHU - Angers
• Aquarelle Santé - Angers
• Institut Paoli-Calmettes - Marseille
Données primaires (corpus) ortolang-000923
Corpus Aquarel Santé (Jorane SAUBESTY)
Dépôt personnel

Corpus de formation des médecins à l’annonce d’événements indésirables graves mise en place au CHU d’Angers par l’organisme Aquarel Santé.

Corpus vidéo.


(discourse_analysis)
français

>> Collection ACORFORMed ortolang-000922
picto picto2
hdl:11041/ortolang-000923
2015-05-21
Version 1
données source
• Aquarel santé - Angers
• CHU - Angers
Données secondaires (ressource) ortolang-000921
Happy Birthday Corpus - Data (Pauline LARROUY-MAESTRI)
Dépôt personnel

Analyses acoustiques (justesse, tempo, qualité vocale) et évaluations (par 18 juges experts en musique et 18 juges non experts, appariés en âge et genre) des 166 performances contenues dans le Corpus “Happy Birthday“.

hdl:11041/ortolang-000921
2015-05-15
Version 1
données source
Données secondaires (ressource) ortolang-000920
Lexical functions of Spanish verb-noun collocations (Olga KOLESNIKOVA)
Dépôt personnel

The resource include first most frequent 1000 verb-noun pairs extracted automatically from the Spanish Web Corpus (located at http://www.sketchengine.co.uk). Each pair is classified as a free word combination (FWC), a collocation, or an error (of parsing). In FWCs and collocations, verbs and nouns are annotated with the Spanish WordNet senses. Each collocation is annotated with its lexical function. [...]


espagnol
hdl:11041/ortolang-000920
2015-05-14
Version 1
données source
(Diverses publications)

This material is Open Data
Données primaires (corpus) ortolang-000919
Corpus IPC (Jorane SAUBESTY)
Dépôt personnel

Corpus de formation des médecins à l’annonce d’événements indésirables graves.

Source du corpus : l’Institut Paoli-Calmettes de Marseille.

Corpus vidéo/audio avec transcriptions et annotations.


(discourse_analysis)
français

>> Collection BLRI blri-000835
>> Collection ACORFORMed ortolang-000922
picto picto2
hdl:11041/ortolang-000919
2015-05-12
Version 1
données source
• Institut Paoli-Calmettes - Marseille
• Brain and Language Research Institute - Aix-en-Provence
Données secondaires (ressource) ortolang-000918
CID-DISP (Roxane Bertrand, Laboratoire parole et langage - UMR 7309, Laurent Prévot, Laboratoire parole et langage - UMR 7309, Stéphane Rauzy, Laboratoire parole et langage - UMR 7309)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Syntactic, Prosodic, Discourse and Disfluencies annotation for the CID corpus


(general_linguistics, phonetics, phonology, speech_prosody, computational_linguistics)
hdl:11041/ortolang-000918
2015-04-30
Version 1
données source
page 1  >>

Les 8 objets les plus téléchargés sous licence SLDR
Données secondaires (ressource) Transcriptions du corpus CID - Roxane BERTRANDTéléchargé 103 fois (?)
Données primaires (corpus) Vidéos du corpus CID - Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)Téléchargé 96 fois (?)
Données primaires (corpus) Aix-MARSEC base de données - Cyril Auran, Savoirs, textes et langage, Caroline Bouzon, Savoirs, textes et langage, Céline De Looze, Savoirs, textes et langage, Daniel Hirst, Laboratoire parole et langageTéléchargé 85 fois (?)
Outil MarsaTag - Stéphane Rauzy, CNRS - LPLTéléchargé 40 fois (?)
Données secondaires (ressource) VfrLPL - Stéphane RAUZYTéléchargé 32 fois (?)
Données primaires (corpus) MAPTASK-AIX - Ellen Bard, Corine Astésano, Cheryl Frenck-Mestre, Mariapaola D'imperio, Alice Turk, Noël NguyenTéléchargé 25 fois (?)
Données primaires (corpus) ANGLISH - Daniel Hirst, Anne TortelTéléchargé 25 fois (?)
Données secondaires (ressource) Grammaire du français (GP) - Marie-Laure GUéNOTTéléchargé 21 fois (?)

Les 8 objets les plus téléchargés en libre accès (depuis le 4/4/2013)
Données secondaires (ressource) Spoken language reference materials - Dafydd Gibbon, Roger Moore, Richard WinskiTéléchargé 1776 fois
Outil Phonedit SIGNAIX - Robert Espesser, Alain Ghio, Tatsuya WatanabeTéléchargé 1372 fois
Données secondaires (ressource) Intonation and Emphasis - Daniel HIRSTTéléchargé 1199 fois
Données secondaires (ressource) INTSINT - Daniel HIRSTTéléchargé 1156 fois
Outil MELISM - Geneviève CAELEN-HAUMONTTéléchargé 1139 fois
Données secondaires (ressource) Annotations : Dialogue français (role-play) - Yukihiro NISHINUMATéléchargé 1000 fois
Données secondaires (ressource) Glossaire de phonologie articulatoire - Alain Marchal, Laboratoire parole et langage - UMR 7309Téléchargé 974 fois
Données secondaires (ressource) Valjouffrey - travaux - Médéric Gasquet-Cyrus, Laboratoire Parole et Langage, Clément Girard, Audrey Thomas, Laboratoire Parole et LangageTéléchargé 906 fois

Ce site a fait l’objet d’une déclaration (No 1222972) le 26 mars 2008 à la Commission Nationale de l’Informatique et des Libertés (CNIL). Conformément à la législation française, toute personne citée nominativement dispose d’un droit d’accès, de modification, de rectification et de suppression des données qui la concernent (art. 34 de la loi « Informatique et Libertés » du 6 janvier 1978). Pour exercer ce droit, envoyez un message à webmaster(arobase)sldr.org.

La navigation sur ce site est optimisée pour FireFox ou tout navigateur avec l'option « utiliser les onglets » activée.