ORTOLANG Deposit and sharing

Speech and Language Data Repository (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

Open archives (OAI-PMH)

Lost in migration ? This document may help you : infoMigration-en_0.2.pdf

New deposits and registration of new users must now be done on Ortolang platform.

Deposit and sharing of oral/multimodal linguistic data

As of 01/12/2015, deposit of data on SLDR website will be suspended to allow the public opening of Ortolang platform.

Detailed query

The latest deposits (169) >> more<<  page 3  >>
Primary data (corpus) sldr000786
MARC-Fr (Brigitte Bigi, Pauline Péri)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Corpus français manuellement phonétisé et aligné d’une durée de 7 minutes. Composé de 3 sous-corpus : CID, AixOx et Grenelle.


(phonology, phonetics, speech_prosody, general_linguistics, computational_linguistics, text_and_corpus_linguistics)
French (français)

>> Collection Multimodalité et débats à l'Assemblée nationale - Multimodality and debates in the National Assembly sldr000729
hdl:11041/sldr000786
2014-05-05
Version 1
source data

This material is Open Data
Secondary data (resource) sldr000874
Articulatory Phonology Lexicon (Alain Marchal, Laboratoire parole et langage - UMR 7309)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Articulatory Phonology Lexicon (in French)


(phonology, phonetics)
hdl:11041/sldr000874
2014-03-13
Version 1
source data

This material is Open Data
[ARK] Tool sldr000526
Anonymise sound files (Daniel HIRST)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

PRAAT script.
Purpose: replace portions of a long sound which are labelled with a key word on the accompanying TextGrid with a hum sound with the same prosodic characteristics as the original sound.
Original long sound can be mono or stereo, anonymised sound will be same.
TextGrid may be constructed from simple table using Table2textgrid.


(applied_linguistics, cognitive_science, language_documentation, speech_prosody, computational_linguistics)

>> Collection LPL tools lpl-000763
hdl:11041/sldr000526
2014-01-24
Version 5
long-term preservation
Primary data (corpus) sldr000870
Corpus audio de teko (émérillon) (Françoise ROSE)
Dynamique du langage - UMR 5596 (DDL, Lyon FR)

Collection of recordings of the Teko (Emerillon) language, a Tupi-Guarani language spoken in French Guiana. Recordings are linked to a transcription, French translation, morphological parsing with parts of speech information (data exported from Toolbox).


(language_documentation, text_and_corpus_linguistics)
Emerillon (teko)
picto picto2
hdl:11041/sldr000870
2014-01-21
Version 1
source data
Google earth
OpenStreetMap

This material is Open Data
Primary data (corpus) sldr000869
Français parlé dans le nord du Gabon (Magali ITALIA)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Français parlé par des Gabonais du nord du pays, des locuteurs âgés peu ou pas scolarisés et de jeunes adultes moyennement scolarisés.


(syntax, morphology, discourse_analysis)
French (français)
picto
hdl:11041/sldr000869
2014-01-14
Version 1
source data
Google earth
OpenStreetMap
Primary data (corpus) sldr000863
Francique et français se mélangent - Francique et français se mélangent (Amélie SCHNEIDER)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Conversation téléphonique d’une locutrice mosellane (50a, née à Bining, langue maternelle : dialecte, autres langues : français, allemand, anglais) avec sa sœur mosellane (49 a, née à Bining, langue maternelle : dialecte, autres langues : français, allemand) en parole spontanée, enregistré au format MP3 à l’aide de mon téléphone portable, puis converti au format [...]


(computational_linguistics, sociolinguistics)
Old High German -> Rhine Franconian (Rheinfränkisch)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000863
2014-01-09
Version 1
source data
Primary data (corpus) sldr000868
JURISDICT (Adam Mickiewicz University Foundation (Poznan PL))
Adam Mickiewicz University Foundation (Poznan PL)

The JURISDICT speech database is a large continuous speech database originally designed for dictated speech recognition.
The database includes above 1500 annotated sessions of speakers from 16 regions of Poland, plus another 500 experimental recordings.
The JURISDICT database is intended to provide material for both training and testing of speech dictation of common and legal texts, [...]


(applied_linguistics, phonetics, phonology)
Polish (język polski)
Not (yet) available from this site.
hdl:11041/sldr000868
2014-01-09
Version 1
source data
Primary data (corpus) sldr000867
Code d’alternance dans un contact de langue chez un locuteur berbère (Smail TOUMERT)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Cet enregistrement a été réalisé dans le cadre de parole spontanée durant une conversation téléphonique entre deux étudiants algériens- à savoir moi même entant que locuteur 1 et locuteur 2 dont on entend pas sa voix- qui vivent en France. Les langues parlées sont le français et une variété du berbère qui est le kabyle.


(computational_linguistics, sociolinguistics)
Kabyle (Taqbaylit)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000867
2014-01-08
Version 1
source data
Primary data (corpus) sldr000866
Corpus-e/ɛ - Corpus-e/ɛ (Ouissam BAIDADA)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus se compose d’un enregistrement de quatre listes de mots contenant /e/ et /ɛ/ dans des positions différentes, produites par des locuteurs méridionaux. Le but de ce corpus est de montrer la difficulté de discrimination de contraste /e/-/ɛ/ en situation de production par des sujets méridionaux.


(computational_linguistics, phonetics, text_and_corpus_linguistics, phonology)
French (français)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000866
2014-01-06
Version 1
source data
Primary data (corpus) sldr000865
CORPUS LOG (Aurélie GOUJON)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus LOG est composé de 2 vidéos et de leurs enregistrements audio. La première vidéo, en français, dure 2.58 secondes. La seconde, en italien, dure 1.29 secondes. La locutrice a pour tâche de raconter un extrait de dessin animé, une première fois en français face à un interlocuteur français, une seconde fois en italien face à une interlocutrice italienne. La locutrice est italienne [...]


(computational_linguistics, psycholinguistics)
French (français)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto
hdl:11041/sldr000865
2014-01-01
Version 1
source data
Primary data (corpus) sldr000864
Rhythmic priming enhances speech production abilities: evidence from prelingually deaf children (Céline HIDALGO)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Échantillons de corpus enregistrés lors d’une étude (soumise à publication) menée conjointement par l’Institut des Neurosciences des Systèmes et le CAMSP Déficiences Auditives de la Timone. 14 enfants sourds prélinguaux âgés de 5 à 13 ans ont été soumis à des répétitions de phrases sans (baseline), puis avec répétition d’un amorçage rythmique (expérience); cet amorçage étant [...]


(cognitive_science, language_acquisition, speech_prosody)
French (français)
picto
hdl:11041/sldr000864
2013-12-30
Version 1
source data
Primary data (corpus) sldr000857
“The Frog Story“ in Hindi (Alice JURY)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Audio corpus of "spontaneous" speech in Hindi.
A Hindi speaker tells a story from a picture book for kids ("Frog Where Are You", Mayer 1969), known in the world of linguistics as "The Frog Story".
This story has been frequently used by typologists, following Talmy’s work (1985), to analyze verbs featuring movement (motion events). This corpus has been built for the same purpose.


(computational_linguistics, typology, syntax)
Hindi (हिन्दी)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000857
2013-12-20
Version 1
source data
Primary data (corpus) sldr000852
Le lexique de la désignation - Le lexique de la désignation (Léo BAIOCCHI)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus audio vient renforcer une enquête sociolinguistique menée en 2013 ; cette enquête est décrite comme suit :
"Nous nous intéressons à ce que nous appelons la désignation, c’est-à-dire au lexique employé par un locuteur pour en désigner un autre. On peut considérer que c’est un aspect particulier de la dénomination (d’un locuteur à un autre), qui possède un [...]


(computational_linguistics, sociolinguistics, lexicography)
French (français)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto

hdl:11041/sldr000852
2013-12-16
Version 1
source data
Secondary data (resource) sldr000850
MarsaLex - MarsaLex (Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR))
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

LPL MarsaTag lexicons.
A French morphosyntactic lexicon and a complementary lexicon for speech.
The main lexicon contains about 595M inflected forms (59M distinct lemmas).
The speech lexicon contains a hundred forms.


(general_linguistics, computational_linguistics)
French
picto
Creative Commons License
MarsaLex by Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR) is licensed under a Creative Commons Attribution 4.0 International License.
hdl:11041/sldr000850
2013-12-10
Version 1
source data
(Misc publications)

This material is Open Data
Collection sldr000849
Marseille en V.O.
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Observation in situ des pratiques plurilingues. Ce projet envisage de décrire les pratiques langagières plurilingues marseillaises à partir d’un corpus de données collectées dans des conditions écologiques. Il a été conçu pour répondre plus précisément à la question suivante : comment se mesure et se décrit le plurilinguisme d’une ville ?


(sociolinguistics)
picto picto2
hdl:11041/sldr000849
2013-12-09
Version 1
source data
Primary data (corpus) sldr000848
Subordinadas condicionales en Quechua Cochabambino (Corentin BOURDEAU)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

This record deals with the if-clauses in Quechua Cochabambino. This elicitation aims at elaborating a typology of these clauses.


(computational_linguistics, typology)
Quechua (runasimi)

>> Collection Travaux d'étudiants Master LEX sldr000804

hdl:11041/sldr000848
2013-12-08
Version 1
source data
Primary data (corpus) sldr000837
Analyse du regard lors de la description d'un dessin - Analyse du regard lors de la description d'un dessin (Charlotte BOUGET)
Département de sciences du langage, Université d'Aix-Marseille (Aix-en-Provence FR)

Ce corpus d’analyse du regard lors de la description d’un dessin est composé d’une séquence de 3min50 avec enregistrement audio et vidéo.
Le locuteur doit décrire de mémoire une figure (figure complexe de Rey) pour que l’interlocuteur puisse la redessiner.
L’analyse porte sur le regard du locuteur en fonction de la situation de communication.


(computational_linguistics, psycholinguistics)
French (français)

>> Collection Travaux d'étudiants Master LEX sldr000804
picto
hdl:11041/sldr000837
2013-11-23
Version 1
source data
Primary data (corpus) sldr000845
Les accents de « là-bas » (Centre de documentation historique sur l’Algérie (CDHA, Aix-en-Provence FR), Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR))
Centre de documentation historique sur l’Algérie (CDHA, Aix-en-Provence FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Projet de recherche et de valorisation sur les accents du français d’Afrique du Nord et leurs caractéristiques linguistiques focalisé sur les paramètres socioculturels et sociohistoriques liés à leurs variations.


(general_linguistics, language_documentation, sociolinguistics)
French (français)

>> Collection CDHA cdha-000844
hdl:11041/sldr000845
2013-11-18
Version 1
source data
Primary data (corpus) sldr000843
Repiso/Contrefactualité (Isabel REPISO)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Counterfactual thinking is a universal cognitive process in which reality is compared to an imagined view of what might have been (Kahneman & Tversky 1982). The expression of counterfactuality has been traditionally analyzed from conditional sentences if P (then) Q (Grevisse 1986, Chevalier et al. 1991, Riegel et al. 1994). The present study aims to describe the whole constructions and grammatical [...]


(language_acquisition, psycholinguistics, cognitive_science)
French (français)
hdl:11041/sldr000843
2013-11-04
Version 1
source data
Tool sldr000842
FormantPro (Yi XU)
UCL division of psychology and language sciences (UCL, London UK)

A convenient tool for large-scale, systematic analysis of continuous formant movement trajectories. It allows users to obtain formant and formant velocity trajectories from multiple sound files, take various measurements, and save them in formats ready for graphical and statistical analysis. It also generates averaged trajectories and measurements across repetitions and speakers.


(phonetics, phonology, computational_linguistics)
hdl:11041/sldr000842
2013-10-21
Version 1
source data
Primary data (corpus) sldr000821
Déclaratives avec disjonction (Clément PLANCQ)
Individual contribution

Elicited corpus of assertions


(speech_prosody, pragmatics, semantics)
French (français)


hdl:11041/sldr000821
2013-08-22
Version 1
source data
<<  page 3  >>

This site has been declared to Commission Nationale de l’Informatique et des Libertés (CNIL) under agreement Nr.1222972 on 26 March 2008. As per French Law, any person cited by name is granted access to, modification, correction and suppression of data relative to him/her (art. 34 of the « Informatique et Libertés » act of 6 January 1978). To exert your right, send a message to webmaster(at)sldr.org.

This site is optimized for FireFox or any browser with the 'tabs' option set.