ORTOLANG Dépôt et diffusion

Banque de données parole et langage (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Archives ouvertes (OAI-PMH)

Lost in migration ? Ce document peut vous aider : infoMigration-fr_0.2.pdf

Les nouveaux dépôts et les nouvelles inscriptions s'effectuent désormais sur la plateforme Ortolang.

Dépôt et diffusion de données linguistiques orales et multimodales

A compter du 01/12/2015, le dépôt de données sur le SLDR seront suspendus afin de permettre l'ouverture au public de la plateforme Ortolang.

Recherche avancée

Les dépôts les plus récents (169) >> plus<<  page 3  >>
Données primaires (corpus) sldr000786
MARC-Fr (Brigitte Bigi, Pauline Péri)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Corpus français manuellement phonétisé et aligné d’une durée de 7 minutes. Composé de 3 sous-corpus : CID, AixOx et Grenelle.


(phonology, phonetics, speech_prosody, general_linguistics, computational_linguistics, text_and_corpus_linguistics)
français

>> Collection Multimodalité et débats à l'Assemblée nationale sldr000729
hdl:11041/sldr000786
2014-05-05
Version 1
données source

This material is Open Data
Données secondaires (ressource) sldr000874
Glossaire de phonologie articulatoire (Alain Marchal, Laboratoire parole et langage - UMR 7309)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Glossaire de phonologie articulatoire en français


(phonology, phonetics)
hdl:11041/sldr000874
2014-03-13
Version 1
données source

This material is Open Data
[ARK] Outil sldr000526
Anonymisation de fichiers sonores (Daniel HIRST)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Script PRAAT.
Objet : remplacer les fragments d’un "long sound", étiquetés par un mot-clé sur un TextGrid, par un son murmuré dont les caractéristiques prosodiques sont identiques à celles du son original.
Le fichier source peut être mono ou stéréo, sans incidence sur le résultat.
Le TextGrid peut être créé à partir d’un simple tableau grâce à l’outil Tabl [...]


(applied_linguistics, cognitive_science, language_documentation, speech_prosody, computational_linguistics)

>> Collection Outils LPL lpl-000763
hdl:11041/sldr000526
2014-01-24
Version 5
archive pérenne
Données primaires (corpus) sldr000870
Corpus audio de teko (émérillon) (Françoise ROSE)
Dynamique du langage - UMR 5596 (DDL, Lyon FR)

Collection d’enregistrements de la langue teko (émérillon), une langue tupi-guarani parlée en Guyane française. Les enregistrements sont accompagnées d’une transcription, d’une traduction en français, d’une segmentation morphologique et d’indication sur les parties du discours (données exportées du logiciel Toolbox).


(language_documentation, text_and_corpus_linguistics)
émerillon (teko)
picto picto2
hdl:11041/sldr000870
2014-01-21
Version 1
données source
Google earth
OpenStreetMap

This material is Open Data
Données primaires (corpus) sldr000869
Français parlé dans le nord du Gabon (Magali ITALIA)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Français parlé par des Gabonais du nord du pays, des locuteurs âgés peu ou pas scolarisés et de jeunes adultes moyennement scolarisés.


(syntax, morphology, discourse_analysis)
français
picto
hdl:11041/sldr000869
2014-01-14
Version 1
données source
Google earth
OpenStreetMap
Données primaires (corpus) sldr000863
Francique et français se mélangent (Amélie SCHNEIDER)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Conversation téléphonique d’une locutrice mosellane (50a, née à Bining, langue maternelle : dialecte, autres langues : français, allemand, anglais) avec sa sœur mosellane (49 a, née à Bining, langue maternelle : dialecte, autres langues : français, allemand) en parole spontanée, enregistré au format MP3 à l’aide de mon téléphone portable, puis converti au format [...]


(computational_linguistics, sociolinguistics)
vieux haut-allemand -> francique rhénan (Rheinfränkisch)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000863
2014-01-09
Version 1
données source
Données primaires (corpus) sldr000868
JURISDICT (Adam Mickiewicz University Foundation (Poznan PL))
Adam Mickiewicz University Foundation (Poznan PL)

The JURISDICT speech database is a large continuous speech database originally designed for dictated speech recognition.
The database includes above 1500 annotated sessions of speakers from 16 regions of Poland, plus another 500 experimental recordings.
The JURISDICT database is intended to provide material for both training and testing of speech dictation of common and legal texts, [...]


(applied_linguistics, phonetics, phonology)
polonais (język polski)
Pas (encore) disponible sur ce site.
hdl:11041/sldr000868
2014-01-09
Version 1
données source
Données primaires (corpus) sldr000867
Code d’alternance dans un contact de langue chez un locuteur berbère (Smail TOUMERT)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Cet enregistrement a été réalisé dans le cadre de parole spontanée durant une conversation téléphonique entre deux étudiants algériens- à savoir moi même entant que locuteur 1 et locuteur 2 dont on entend pas sa voix- qui vivent en France. Les langues parlées sont le français et une variété du berbère qui est le kabyle.


(computational_linguistics, sociolinguistics)
kabyle (Taqbaylit)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000867
2014-01-08
Version 1
données source
Données primaires (corpus) sldr000866
Corpus-e/ɛ (Ouissam BAIDADA)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus se compose d’un enregistrement de quatre listes de mots contenant /e/ et /ɛ/ dans des positions différentes, produites par des locuteurs méridionaux. Le but de ce corpus est de montrer la difficulté de discrimination de contraste /e/-/ɛ/ en situation de production par des sujets méridionaux.


(computational_linguistics, phonetics, text_and_corpus_linguistics, phonology)
français

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000866
2014-01-06
Version 1
données source
Données primaires (corpus) sldr000865
CORPUS LOG (Aurélie GOUJON)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus LOG est composé de 2 vidéos et de leurs enregistrements audio. La première vidéo, en français, dure 2.58 secondes. La seconde, en italien, dure 1.29 secondes. La locutrice a pour tâche de raconter un extrait de dessin animé, une première fois en français face à un interlocuteur français, une seconde fois en italien face à une interlocutrice italienne. La locutrice est italienne [...]


(computational_linguistics, psycholinguistics)
français

>> Collection Travaux d'étudiants Master LEX sldr000804
picto
hdl:11041/sldr000865
2014-01-01
Version 1
données source
Données primaires (corpus) sldr000864
Impact de l'amorçage rythmique sur la production de la parole chez l'enfant sourd prélingual (Céline HIDALGO)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Échantillons de corpus enregistrés lors d’une étude (soumise à publication) menée conjointement par l’Institut des Neurosciences des Systèmes et le CAMSP Déficiences Auditives de la Timone. 14 enfants sourds prélinguaux âgés de 5 à 13 ans ont été soumis à des répétitions de phrases sans (baseline), puis avec répétition d’un amorçage rythmique (expérience); cet amorçage étant [...]


(cognitive_science, language_acquisition, speech_prosody)
français
picto
hdl:11041/sldr000864
2013-12-30
Version 1
données source
Données primaires (corpus) sldr000857
“The Frog Story” en Hindi (Alice JURY)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Corpus audio de parole "spontanée" en Hindi.
Un locuteur de Hindi raconte une histoire à partir d’un livre d’images pour enfants ("Frog Where Are You", Mayer 1969), connue dans le monde de la linguistique comme "The Frog Story".
Cette histoire a été fréquemment utilisée par les typologues, dans la lignée de Tamly (1985), pour analyser les verbes de mouvement (motion events). C’est [...]


(computational_linguistics, typology, syntax)
hindi (हिन्दी)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000857
2013-12-20
Version 1
données source
Données primaires (corpus) sldr000852
Le lexique de la désignation (Léo BAIOCCHI)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus audio vient renforcer une enquête sociolinguistique menée en 2013 ; cette enquête est décrite comme suit :
"Nous nous intéressons à ce que nous appelons la désignation, c’est-à-dire au lexique employé par un locuteur pour en désigner un autre. On peut considérer que c’est un aspect particulier de la dénomination (d’un locuteur à un autre), qui possède un [...]


(computational_linguistics, sociolinguistics, lexicography)
français

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000852
2013-12-16
Version 1
données source
Données secondaires (ressource) sldr000850
MarsaLex (Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR))
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Lexiques du tagger MarsaTag du LPL.
Un lexique morphosyntaxique du français et un lexique complémentaire pour l’oral.
Le lexique principal compte environ 595M formes fléchies (59M lemmes différents).
Le lexique de l’oral comprend une centaine de formes.


(general_linguistics, computational_linguistics)
français
picto
Creative Commons License
MarsaLex by Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR) is licensed under a Creative Commons Attribution 4.0 International License.
hdl:11041/sldr000850
2013-12-10
Version 1
données source
(Diverses publications)

This material is Open Data
Collection sldr000849
Marseille en V.O.
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Observation in situ des pratiques plurilingues. Ce projet envisage de décrire les pratiques langagières plurilingues marseillaises à partir d’un corpus de données collectées dans des conditions écologiques. Il a été conçu pour répondre plus précisément à la question suivante : comment se mesure et se décrit le plurilinguisme d’une ville ?


(sociolinguistics)
picto picto2
hdl:11041/sldr000849
2013-12-09
Version 1
données source
Données primaires (corpus) sldr000848
Subordonnées conditionnelles en Quechua Cochabambino (Corentin BOURDEAU)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Cet enregistrement traite des subordonnées conditionnelles en Quechua Cochabambino. Il s’agit d’une élicitation cherchant à élaborer une typologie des conditionnelles dans cette langue.


(computational_linguistics, typology)
quechua (runasimi)

>> Collection Travaux d'étudiants Master LEX sldr000804

hdl:11041/sldr000848
2013-12-08
Version 1
données source
Données primaires (corpus) sldr000837
Analyse du regard lors de la description d'un dessin (Charlotte BOUGET)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus d’analyse du regard lors de la description d’un dessin est composé d’une séquence de 3min50 avec enregistrement audio et vidéo.
Le locuteur doit décrire de mémoire une figure (figure complexe de Rey) pour que l’interlocuteur puisse la redessiner.
L’analyse porte sur le regard du locuteur en fonction de la situation de communication.


(computational_linguistics, psycholinguistics)
français

>> Collection Travaux d'étudiants Master LEX sldr000804
picto
hdl:11041/sldr000837
2013-11-23
Version 1
données source
Données primaires (corpus) sldr000845
Les accents de « là-bas » (Centre de documentation historique sur l’Algérie (CDHA, Aix-en-Provence FR), Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR))
Centre de documentation historique sur l’Algérie (CDHA, Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Projet de recherche et de valorisation sur les accents du français d’Afrique du Nord et leurs caractéristiques linguistiques focalisé sur les paramètres socioculturels et sociohistoriques liés à leurs variations.


(general_linguistics, language_documentation, sociolinguistics)
français

>> Collection CDHA cdha-000844
hdl:11041/sldr000845
2013-11-18
Version 1
données source
Données primaires (corpus) sldr000843
Repiso/Contrefactualité (Isabel REPISO)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Le raisonnement contrefactuel est un procès cognitif universel par lequel la réalité est comparée avec ce qui aurait pu se passer autrement (Kahneman & Tversky 1982). L’expression de la contrefactualité repose traditionnellement sur l’analyse des constructions conditionnelles si A (alors) B (Grevisse 1986, Chevalier et al. 1964, Riegel et al. 1994). Le but de notre étude est de décrire l’ensemble [...]


(language_acquisition, psycholinguistics, cognitive_science)
français
hdl:11041/sldr000843
2013-11-04
Version 1
données source
Outil sldr000842
FormantPro (Yi XU)
UCL division of psychology and language sciences (UCL, London UK)

A convenient tool for large-scale, systematic analysis of continuous formant movement trajectories. It allows users to obtain formant and formant velocity trajectories from multiple sound files, take various measurements, and save them in formats ready for graphical and statistical analysis. It also generates averaged trajectories and measurements across repetitions and speakers.


(phonetics, phonology, computational_linguistics)
hdl:11041/sldr000842
2013-10-21
Version 1
données source
Données primaires (corpus) sldr000821
Déclaratives avec disjonction (Clément PLANCQ)
Dépôt personnel

Corpus élicité de déclaratives


(speech_prosody, pragmatics, semantics)
français


hdl:11041/sldr000821
2013-08-22
Version 1
données source
<<  page 3  >>

Ce site a fait l’objet d’une déclaration (No 1222972) le 26 mars 2008 à la Commission Nationale de l’Informatique et des Libertés (CNIL). Conformément à la législation française, toute personne citée nominativement dispose d’un droit d’accès, de modification, de rectification et de suppression des données qui la concernent (art. 34 de la loi « Informatique et Libertés » du 6 janvier 1978). Pour exercer ce droit, envoyez un message à webmaster(arobase)sldr.org.

La navigation sur ce site est optimisée pour FireFox ou tout navigateur avec l'option « utiliser les onglets » activée.