ORTOLANG Dépôt et diffusion

Banque de données parole et langage (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Archives ouvertes (OAI-PMH)

Lost in migration ? Ce document peut vous aider : infoMigration-fr_0.2.pdf

Les nouveaux dépôts et les nouvelles inscriptions s'effectuent désormais sur la plateforme Ortolang.

Dépôt et diffusion de données linguistiques orales et multimodales

A compter du 01/12/2015, le dépôt de données sur le SLDR seront suspendus afin de permettre l'ouverture au public de la plateforme Ortolang.

Recherche avancée

Les dépôts les plus récents (169) >> plus<<  page 2  >>
Outil ortolang-000917
MarsaGram - MarsaGram (Grégoire MOREAU DE MONTCHEUIL)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Outils d’exploration de treebanks.
Extraction d’une grammaire hors-contexte (CFG) et de propriétés sur les règles de la grammaire.
Production de pages HTML pour explorer les règles et leurs propriétés.
S’adapte aux treebanks de constituants et de dépendance.


(applied_linguistics, cognitive_science, language_documentation, computational_linguistics, text_and_corpus_linguistics)

>> Collection Outils LPL lpl-000763
hdl:11041/ortolang-000917
2015-04-09
Version 1
données source
(Diverses publications)
• ORTOLANG

This material is Open Data
Données primaires (corpus) ortolang-000916
CREAGEST - Acquisition (Structures formelles du langage - UMR 7023 (SFL, Paris FR), Savoirs, textes et langage - UMR 8163 (STL, Lille FR), Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR))
Structures formelles du langage - UMR 7023 (SFL, Paris FR)
Savoirs, textes et langage - UMR 8163 (STL, Lille FR)
Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR)

Il s’agit d’un corpus de LSF enfantine recueilli auprès de 65 enfants sourds (bilingues LSF-Français) et 17 adultes sourds (50 heures), piloté par quatre enquêtrices sourdes de quatre régions de France différentes (4 stimuli, 2 caméras).

Les vidéos mises à disposition ici constituent une sous-partie du corpus global : 10 extraits filmés avec deux caméras (soit 20 fic [...]


(discourse_analysis, sociolinguistics, language_acquisition)
(Non classifié)

>> Collection CREAGEST ortolang-000912
picto
hdl:11041/ortolang-000916
2015-04-08
Version 1
données source
• ANR CREAGEST (2008-2012)

This material is Open Data
Données primaires (corpus) ortolang-000915
VILLA : Varieties of Initial Learners in Language Acquisition - VILLA : Variétés d’apprenants débutants dans l’acquisition des langues (Sarra EL AYARI)
Structures formelles du langage - UMR 7023 (SFL, Paris FR)

Le projet VILLA (ANR, DFG, NWO) examine les premières étapes d’acquisition d’une langue étrangère dans des conditions contrôlées. Des vrais débutants (de 5 langues maternelles différentes: néerlandais, anglais, français, allemand, italien) ont été exposés à 14 h d’une nouvelle langue (polonais). Les tâches en polonais ont permis de suivre leurs itinéraires acquisitionnels.


(language_acquisition, applied_linguistics, psycholinguistics)
polonais (język polski)
hdl:11041/ortolang-000915
2015-03-30
Version 1
données source
(Diverses publications)
• ANR ORA (2011-2013)
Collection ortolang-000912
CREAGEST
Structures formelles du langage - UMR 7023 (SFL, Paris FR)
Savoirs, textes et langage - UMR 8163 (STL, Lille FR)
Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR)

CREAGEST rassemble des discours de Langue des signes française (LSF). Il comprend deux corpus :
1) “CREAGEST - Acquisition“ est un corpus de LSF enfantine recueilli auprès de 65 enfants sourds (bilingues LSF-Français) et 17 adultes sourds (50 heures), piloté par quatre enquêtrices sourdes de quatre régions de France différentes (4 stimuli, 2 caméras);
2) “CREAGEST - Dialogue [...]


(discourse_analysis, sociolinguistics, language_acquisition)
langue des signes française
hdl:11041/ortolang-000912
2015-02-17
Version 1
données source
(Diverses publications)
• ANR CREAGEST (2008-2012)
Collection ortolang-000911
CoFee - CoFee
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

4 corpora used as primary dataset for the ANR JCJC “Conversational Feedback“. Some of the corpora were pre-existing while some other have been created within this project. In addition to Primary data, annotations (ELAN files) and resulting datasets (CSV files) related to conversational feedback are alao included.

hdl:11041/ortolang-000911
2015-02-15
Version 1
données source
Données secondaires (ressource) sldr000735
Annotations of grindmill songs - Annotations des chants de la mouture (Guy Poitevin, Hema Rairkar)
Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)

Annotations des chants de la mouture
• Transcriptions en Devanagari et Roman Devanagari
* Conversion de toutes les bases de données en Unicode UTF8 (XML, TAB, CSV)
• Traduction en anglais (à compléter)
• Traduction en français (à compléter)
• Informations sur les interprètes
• Information about recording places
• Classification [...]


(sociolinguistics, anthropological_linguistics)
marathi; marathi -> marathi rural

>> Collection Popular cultural productions in Marathi language - Productions culturelles populaires en langue marathi ccrss-000749
hdl:11041/sldr000735
2015-02-15
Version 1
données source
Google earth
OpenStreetMap
• International Fund for the Promotion of Culture (UNESCO) (1993-1998)
• Netherlands Ministry for Development Cooperation (1993-1998)
• Fondation Charles-Léopold Mayer pour le Progrès de l'Homme

This material is Open Data
Outil sldr000841
MarsaTag (Stéphane Rauzy, CNRS - LPL)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Plateforme d’enrichissement de données textuelles (texte écrit et transcription de l’oral) : tokenizer, étiquetage morphosyntaxique, POS tagger, ...


(general_linguistics, computational_linguistics)
français
picto
hdl:11041/sldr000841
2015-01-21
Version 1
données source
(Diverses publications)

This material is Open Data
Données primaires (corpus) blri-000904
Projet ADys (MEG) (Jean-Michel Badier, INS, Eddy Cavalli, LPC, Pascale Colé, LPC, Catherine Liégeois-Chauvel, INS, Chotiga Pattamadilok, LPL, Florence Poracchia-George, INS, Johannes Ziegler, LPC)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Institut de Neurosciences des Systèmes (INS, Marseille FR)

Traitement morphologique, orthographique et sémantique dans la lecture des étudiants dyslexiques mis en évidence avec la MEG
Morphological, orthographic and semantic processing in reading of dyslexic university students revealed by MEG


(neurolinguistics, linguistic_theories)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000904
2014-12-15
Version 1
données source
• Brain and Language Research Institute
Données primaires (corpus) blri-000905
Projet IDIOME (EEG) (Philippe Blache, LPL, Deirdre Bolger, BLRI, Sophie Dufour, LPL, Chotiga Pattamadilok, LPL, Carlos Ramisch, LPL, Stéphane Rauzy, LPL)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)

Interaction entre complexification et facilitation dans le traitement du langage. Etude de la violation de contraintes dans les idiomes.


(cognitive_science, neurolinguistics)
français

>> Collection BLRI blri-000835
picto
hdl:11041/blri-000905
2014-12-15
Version 1
données source
• BLRI
Données secondaires (ressource) ortolang-000722
Annotations du corpus CID (Berthille Pallaud, Laboratoire parole et langage)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Annotations auto-interruptions: A l’oral, les énoncés des locuteurs diffèrent par des auto-interruptions et la présence plus ou moins nombreuse d’éléments « étrangers » insérés dans l’énoncé : pauses silencieuses ou remplies et insertions parenthétiques (marqueurs de discours et interjections) suspendent le déroulement syntagmatique. Toutes les auto-interruptions [...]


(phonology, phonetics, speech_prosody, general_linguistics, computational_linguistics)
français
hdl:11041/ortolang-000722
2014-11-01
Version 1
données source
Données primaires (corpus) ortolang-000893
Berlin (Cyrille Granget)
Didactique des langues, des textes et des cultures - EA2288 (DILTEC, Paris FR)

Corpus pseudo-longitudinal de récits oraux d’une séquence filmique muette. Les récits sont produits en français L2 par des adolescents berlinois, en situation de face à face avec un locuteur dont le français est la L1. Une fiche de vocabulaire est à disposition des narrateurs.
Le film vu est un extrait de Modern Times de Charlie Chaplin, plus précisément la version expérimentale conçue [...]


(applied_linguistics, language_acquisition, psycholinguistics)
français
picto picto2


hdl:11041/ortolang-000893
2014-10-29
Version 1
données source
(Diverses publications)
• IRCOM
• ORTOLANG
Données secondaires (ressource) ortolang-000903
Corpus ANCOR Centre (Jean-Yves Antoine, LI)
Laboratoire d‘Informatique (LI, Tours FR)
Laboratoire Ligérien de Linguistique (LLL, Orléans FR)
Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)

ANCOR Centre est un corpus francophone d’envergure (488 000 mots) de parole spontanée annoté en anaphores et coréférences portant aussi bien sur des entités nominales que pronominales. L’annotation a été réalisée sur trois corpus de parole conversationnelle (Accueil_UBS, OTG et ESLO) diffusés également librement. Le corpus ANCOR_Centre est distribué gratuitement sous licence Creative [...]


(computational_linguistics, text_and_corpus_linguistics, speech_prosody, general_linguistics)
français
hdl:11041/ortolang-000903
2014-10-26
Version 1
données source
(Diverses publications)
Collection ortolang-000901
VariAMU

The VariAMU collection is a data and tools repository.
The crucial goal of Variamu is to have comparable datasets in order to make cross-linguistic comparisons.


(general_linguistics, computational_linguistics)
anglais; français; cantonais; chinois; portugais
hdl:11041/ortolang-000901
2014-10-17
Version 1
données source
Données primaires (corpus) sldr000875
Audio-visual condition of Aix Map Task (Jan Gorisch, Laurent Prévot)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Ceci est la condition audio-visuelle du corpus Aix Map task. Deux participants sont assis face-à-face et effectuent la Map Task.


(discourse_analysis, computational_linguistics, phonetics)
français
hdl:11041/sldr000875
2014-10-13
Version 1
données source
(Diverses publications)

This material is Open Data
Données primaires (corpus) ortolang-000900
Loup garou (Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR), Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR))
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)

Enregistrements multipistes d’interactions entre joueurs du « Loup garou ». Étudiants en master LEX, cours corpus 1 (SCLQ41) le 7 octobre 2014, salle A003 du LPL. Vidéos caméra fixe plan large.


(computational_linguistics, applied_linguistics, phonetics, sociolinguistics)
français

>> Collection Travaux d'étudiants Master LEX sldr000804
picto




Creative Commons License
Werewolf by Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR), Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR) is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
hdl:11041/ortolang-000900
2014-10-07
Version 1
données source
Google earth
OpenStreetMap

This material is Open Data
Données primaires (corpus) ortolang-000899
Faetano : francoprovençal d’Italie (Priscilla TOLENTINO)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Enregistrements audio et vidéo réalisés dans le cadre du projet de thèse Contact de langues en France et en Italie : étude de deux variétés de gallo-roman


(typology, sociolinguistics)
francoprovençal -> faetar (Faitare)
hdl:11041/ortolang-000899
2014-10-02
Version 1
données source
Données primaires (corpus) sldr000787
Valjouffrey-Valbonnais 2012-2014 (Médéric GASQUET-CYRUS)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)

Enregistrements son/vidéo réalisés dans le cadre du projet « Mémoires et pratiques linguistiques en zone de transition entre francoprovençal et occitan : Valjouffrey et Valbonnais »


(language_documentation, lexicography, sociolinguistics)
occitan (post 1500) -> provençal; occitan (post 1500) -> provençal alpin ou nord-occitan; occitan (post 1500) -> patois de Valbonnais; francoprovençal; français

>> Collection Valjouffrey-Valbonnais valjouffrey-000007
picto picto2

Entretien avec Bernard Bel et Médéric Gasquet-Cyrus sur Radio Mont Aiguille, 16/9/12

Le laboureur et ses enfants (Robert Bois, Etienne Champollion, Damien Roquetty)

Le temps des cerises (Robert Bois, Etienne Champollion, Damien Roquetty)
hdl:11041/sldr000787
2014-07-31
Version 1
données source
Google earth
OpenStreetMap
• Conseil Régional Rhône-Alpes
Données primaires (corpus) ortolang-000894
Read speech in Italian L1 (Sandra CORNAZ)
Grenoble Images Parole Signal Automatique - UMR 5216 (Gipsa, Grenoble FR)
Laboratorio di Fonetica Sperimentale ’Arturo Genere’ dell’Università di Torino (LFSAG, Torino IT)

Env. 50 locuteurs de langue maternelle italienne. Enregistrements de trois types de lecture : phrases de type ’bene, Iris e Ugo, mangiamo una bella pesca’; texte de “Il Vento di tramontana e il sole“; phrases sans signification : ’V, hai detto V, V come in CV’.
Circa 50 locutori italiano lingua materna. Registrazioni di tre tipi di lettura : frasi di tipo ’bene, Iris e Ugo, mangiamo una bella pesca’; testo di “Il Vento di tramontana e il sole“; frasi senza senso : ’V, hai detto V, V come in CV’.


(phonetics, phonology, text_and_corpus_linguistics)
italien (Italiano)
hdl:11041/ortolang-000894
2014-07-17
Version 1
données source
Google earth
OpenStreetMap
Outil ortolang-000895
Script praat pour recueil infos acoustiques (Sandra CORNAZ)
Grenoble Images Parole Signal Automatique - UMR 5216 (Gipsa, Grenoble FR)

Script à utiliser à partir d’un TextGrid (en particulier généré sous SPPAS). Permet de récupérer les infos suivantes pour chaque partie segmentée : étiquette, durée, F0, F1, F2, F3, F4, et pour chacune la std et la bandw. Les mesures de formants sont calculées à partir de la médiane des valeurs recueillies toutes les 10 ms sur la partie segmentée. Ce script a été modifié pour [...]


(phonetics, computational_linguistics)
hdl:11041/ortolang-000895
2014-07-14
Version 1
données source
Google earth
OpenStreetMap

This material is Open Data
Données primaires (corpus) sldr000892
La compétence pragmatique en négociation (Français Langue Etrangère par des Singapouriens, niveaux A2 et B1) (Isabel REPISO)
Dépôt personnel

Deux jeux de rôles ont été proposés aux étudiants : un premier visant une négociation en milieu institutionnel et un deuxième en milieu familial.


(language_acquisition, discourse_analysis, syntax)
français
hdl:11041/sldr000892
2014-07-01
Version 1
données source
Données primaires (corpus) alipe-000853
ALIPE (Acquisition de la Liaison et Interactions Parents Enfants) (Damien Chabanal, Thierry Chanier, Loïc Liégeois)
Laboratoire de Recherche sur le Langage - EA 999 (LRL, Clermont-Ferrand FR)

Interactions parents-enfant annotées pour l’étude de la liaison.
Ce corpus contient la transcription d’environ 15H de conversations informelles entre enfant et parents.
Les données de ce corpus ont été structurées dans le cadre du projet ALIPE (Acquisition de la Liaison et Interactions Parents Enfants) du Laboratoire de Recherche sur le Langage.


(language_acquisition, phonology)
français

    hdl:11041/alipe-000853
    2014-05-19
    Version 1
    données source
    • IRCOM
    • ORTOLANG
    <<  page 2  >>

    Ce site a fait l’objet d’une déclaration (No 1222972) le 26 mars 2008 à la Commission Nationale de l’Informatique et des Libertés (CNIL). Conformément à la législation française, toute personne citée nominativement dispose d’un droit d’accès, de modification, de rectification et de suppression des données qui la concernent (art. 34 de la loi « Informatique et Libertés » du 6 janvier 1978). Pour exercer ce droit, envoyez un message à webmaster(arobase)sldr.org.

    La navigation sur ce site est optimisée pour FireFox ou tout navigateur avec l'option « utiliser les onglets » activée.