ORTOLANG 存款和共享

Speech and Language Data Repository (SLDR/ORTOLANG)

Investissements d'avenir  Huma-Num  CLARIN

打开档案 (OAI-PMH)

Lost in migration ? This document may help you : infoMigration-en_0.2.pdf

New deposits and registration of new users must now be done on Ortolang platform.

存款和共享的口头和多语言数据

As of 01/12/2015, deposit of data on SLDR website will be suspended to allow the public opening of Ortolang platform.

搜索

最近的个上传文件 (169) >> 更多<<  页 2  >>
工具 ortolang-000917
MarsaGram - MarsaGram (Grégoire MOREAU DE MONTCHEUIL)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Tool to explore treebanks.
Extract a context-free grammar (CFG) and properties over the CFG rules.
Generate HTML pages to explore the rules and their properties.
Versatile : for constituents or dependencies treebanks.


(applied_linguistics, cognitive_science, language_documentation, computational_linguistics, text_and_corpus_linguistics)

>> 汇集 LPL tools lpl-000763
hdl:11041/ortolang-000917
2015-04-09
Version 1
源数据
(Misc publications)
• ORTOLANG

This material is Open Data
语音库 ortolang-000916
CREAGEST - Acquisition (Structures formelles du langage - UMR 7023 (SFL, Paris FR), Savoirs, textes et langage - UMR 8163 (STL, Lille FR), Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR))
Structures formelles du langage - UMR 7023 (SFL, Paris FR)
Savoirs, textes et langage - UMR 8163 (STL, Lille FR)
Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR)

Il s’agit d’un corpus de LSF enfantine recueilli auprès de 65 enfants sourds (bilingues LSF-Français) et 17 adultes sourds (50 heures), piloté par quatre enquêtrices sourdes de quatre régions de France différentes (4 stimuli, 2 caméras).

Les vidéos mises à disposition ici constituent une sous-partie du corpus global : 10 extraits filmés avec deux caméras (soit 20 fic [...]


(discourse_analysis, sociolinguistics, language_acquisition)
(未保密)

>> 汇集 CREAGEST ortolang-000912
picto
hdl:11041/ortolang-000916
2015-04-08
Version 1
源数据
• ANR CREAGEST (2008-2012)

This material is Open Data
语音库 ortolang-000915
VILLA : Varieties of Initial Learners in Language Acquisition - VILLA : Varieties of Initial Learners in Language Acquisition (Sarra EL AYARI)
Structures formelles du langage - UMR 7023 (SFL, Paris FR)

VILLA (ANR, DFG, NWO) investigates the very first phases of foreign language acquisition under controlled input conditions. Our learners, total beginners with five different native languages (French, German, Dutch, English, Italian) were exposed to 14 hours of target language Polish. Regular tasks in Polish documented the acquisitional path of all learners.


(language_acquisition, applied_linguistics, psycholinguistics)
波兰语 (język polski)
hdl:11041/ortolang-000915
2015-03-30
Version 1
源数据
(Misc publications)
• ANR ORA (2011-2013)
汇集 ortolang-000912
CREAGEST
Structures formelles du langage - UMR 7023 (SFL, Paris FR)
Savoirs, textes et langage - UMR 8163 (STL, Lille FR)
Groupe d’imagerie neurofonctionnelle - UMR 6194, CNRS/CEA/Université de Caen (Caen FR)

CREAGEST rassemble des discours de Langue des signes française (LSF). Il comprend deux corpus :
1) “CREAGEST - Acquisition“ est un corpus de LSF enfantine recueilli auprès de 65 enfants sourds (bilingues LSF-Français) et 17 adultes sourds (50 heures), piloté par quatre enquêtrices sourdes de quatre régions de France différentes (4 stimuli, 2 caméras);
2) “CREAGEST - Dialogue [...]


(discourse_analysis, sociolinguistics, language_acquisition)
法语手势语
picto
hdl:11041/ortolang-000912
2015-02-17
Version 1
源数据
(Misc publications)
• ANR CREAGEST (2008-2012)
汇集 ortolang-000911
CoFee - CoFee
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

4 corpora used as primary dataset for the ANR JCJC “Conversational Feedback“. Some of the corpora were pre-existing while some other have been created within this project. In addition to Primary data, annotations (ELAN files) and resulting datasets (CSV files) related to conversational feedback are alao included.

hdl:11041/ortolang-000911
2015-02-15
Version 1
源数据
资源 sldr000735
Annotations of grindmill songs - Annotations of grindmill songs (Guy Poitevin, Hema Rairkar)
Centre for Cooperative Research in Social Sciences (CCRSS, Pune IN)

Annotations of grindmill songs
• Transcriptions in Devanagari and Roman Devanagari scripts
* Conversion of all databases to Unicode UTF8 (XML, TAB, CSV)
• English translations (to be completed)
• French translations (to be completed)
• Information about performers
• Information about recording places
• Melodic classification (incomplete)


(
sociolinguistics, anthropological_linguistics)
马拉文; 马拉文 -> 马拉文, rural

>> 汇集 Popular cultural productions in Marathi language - Popular cultural productions in Marathi language ccrss-000749
hdl:11041/sldr000735
2015-02-15
Version 1
源数据
Google earth
OpenStreetMap
• International Fund for the Promotion of Culture (UNESCO) (1993-1998)
• Netherlands Ministry for Development Cooperation (1993-1998)
• Fondation Charles-Léopold Mayer pour le Progrès de l'Homme

This material is Open Data
工具 sldr000841
MarsaTag (Stéphane Rauzy, CNRS - LPL)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Tools for textual data enrichment (written text and speech transcription) : tokenizer, morphosyntactic & POS tagger, ...


(general_linguistics, computational_linguistics)
法语
picto
hdl:11041/sldr000841
2015-01-21
Version 1
源数据
(Misc publications)

This material is Open Data
语音库 blri-000904
Projet ADys (MEG) (Jean-Michel Badier, INS, Eddy Cavalli, LPC, Pascale Colé, LPC, Catherine Liégeois-Chauvel, INS, Chotiga Pattamadilok, LPL, Florence Poracchia-George, INS, Johannes Ziegler, LPC)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Institut de Neurosciences des Systèmes (INS, Marseille FR)

Traitement morphologique, orthographique et sémantique dans la lecture des étudiants dyslexiques mis en évidence avec la MEG
Morphological, orthographic and semantic processing in reading of dyslexic university students revealed by MEG


(neurolinguistics, linguistic_theories)
法语 (français)

>> 汇集 BLRI blri-000835
picto
hdl:11041/blri-000904
2014-12-15
Version 1
源数据
• Brain and Language Research Institute
语音库 blri-000905
Projet IDIOME (EEG) - Projet IDIOME (EEG) (Philippe Blache, LPL, Deirdre Bolger, BLRI, Sophie Dufour, LPL, Chotiga Pattamadilok, LPL, Carlos Ramisch, LPL, Stéphane Rauzy, LPL)
Laboratoire de Psychologie Cognitive - UMR7290 (LPC, Marseille FR)

Interaction between complexity and facilitation in language processing. Study of the violation of constraints idioms


(cognitive_science, neurolinguistics)
法语 (français)

>> 汇集 BLRI blri-000835
picto
hdl:11041/blri-000905
2014-12-15
Version 1
源数据
• BLRI
资源 ortolang-000722
Annotations of CID (Berthille Pallaud, Laboratoire parole et langage)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Annotations auto-interruptions: A l’oral, les énoncés des locuteurs diffèrent par des auto-interruptions et la présence plus ou moins nombreuse d’éléments « étrangers » insérés dans l’énoncé : pauses silencieuses ou remplies et insertions parenthétiques (marqueurs de discours et interjections) suspendent le déroulement syntagmatique. Toutes les auto-interruptions [...]


(phonology, phonetics, speech_prosody, general_linguistics, computational_linguistics)
法语
hdl:11041/ortolang-000722
2014-11-01
Version 1
源数据
语音库 ortolang-000893
Berlin (Cyrille Granget)
Didactique des langues, des textes et des cultures - EA2288 (DILTEC, Paris FR)

Corpus pseudo-longitudinal de récits oraux d’une séquence filmique muette. Les récits sont produits en français L2 par des adolescents berlinois, en situation de face à face avec un locuteur dont le français est la L1. Une fiche de vocabulaire est à disposition des narrateurs.
Le film vu est un extrait de Modern Times de Charlie Chaplin, plus précisément la version expérimentale conçue [...]


(applied_linguistics, language_acquisition, psycholinguistics)
法语 (français)
picto picto2


hdl:11041/ortolang-000893
2014-10-29
Version 1
源数据
(Misc publications)
• IRCOM
• ORTOLANG
资源 ortolang-000903
Corpus ANCOR Centre (Jean-Yves Antoine, LI)
Laboratoire d‘Informatique (LI, Tours FR)
Laboratoire Ligérien de Linguistique (LLL, Orléans FR)
Langues, textes, traitements informatiques, cognition - UMR 8094 (LaTTiCe, Paris FR)

ANCOR Centre is a French spoken corpus annotated in coreference whose size (488,000 words) is sufficient to investigate the achievement of data oriented systems of coreference resolution. The annotation was conducted on three different corpora of conversational speech (Accueil_UBS, OTG, ESLO). It is freely available under Creative Commons CC-BY-SA or CC-BY-SA-NC licence


(computational_linguistics, text_and_corpus_linguistics, speech_prosody, general_linguistics)
法语
hdl:11041/ortolang-000903
2014-10-26
Version 1
源数据
(Misc publications)
汇集 ortolang-000901
VariAMU

The VariAMU collection is a data and tools repository.
The crucial goal of Variamu is to have comparable datasets in order to make cross-linguistic comparisons.


(general_linguistics, computational_linguistics)
英语; 法语; 粵語; 中文; 葡萄牙语
hdl:11041/ortolang-000901
2014-10-17
Version 1
源数据
语音库 sldr000875
Audio-visual condition of Aix Map Task (Jan Gorisch, Laurent Prévot)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

This is the audio-visual condition of the Aix Map Task corpus. Two participants sit face-to-face and complete the Map Task. They are native speakers of French. The audio was recorded on head mounted microphones. The video is recorded individually for each participant on MiniDV cameras. Due to image loss, the audio and video are synchronised using a method described in a paper submitted to the IEEE [...]


(discourse_analysis, computational_linguistics, phonetics)
法语 (français)
hdl:11041/sldr000875
2014-10-13
Version 1
源数据
(Misc publications)

This material is Open Data
语音库 ortolang-000900
Werewolf (Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR), Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR))
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)

Multitrack recordings of interactions betweeen players of the ’Werewolf’ game. Students of the LEX Master course (SCLQ41) on 7 October 2014, room A003 of Laboratoire Parole et Langage.


(computational_linguistics, applied_linguistics, phonetics, sociolinguistics)
法语 (français)

>> 汇集 Travaux d'étudiants Master LEX sldr000804
picto




Creative Commons License
Werewolf by Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR), Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR) is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
hdl:11041/ortolang-000900
2014-10-07
Version 1
源数据
Google earth
OpenStreetMap

This material is Open Data
语音库 ortolang-000899
Faetano : francoprovençal d’Italie - Faetano : francoprovençal d’Italie (Priscilla TOLENTINO)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)

Enregistrements audio et vidéo réalisés dans le cadre du projet de thèse Contact de langues en France et en Italie : étude de deux variétés de gallo-roman


(typology, sociolinguistics)
法语-Provençal -> Faetar (Faitare)
hdl:11041/ortolang-000899
2014-10-02
Version 1
源数据
语音库 sldr000787
Valjouffrey-Valbonnais 2012-2014 (Médéric GASQUET-CYRUS)
Laboratoire parole et langage - UMR 7309 (LPL, Aix-en-Provence FR)
Département de linguistique et phonétique générales, Université d'Aix-Marseille (Aix-en-Provence FR)

Audio & video recordings in the context of project “Mémoires et pratiques linguistiques en zone de transition entre francoprovençal et occitan : Valjouffrey et Valbonnais”


(language_documentation, lexicography, sociolinguistics)
奧克語(後 1500) -> 普罗旺斯; 奧克語(後 1500) -> 普罗旺斯阿尔卑斯山或北奥克; 奧克語(後 1500) -> Valbonnais 方言; 法语-Provençal; 法语

>> 汇集 Valjouffrey-Valbonnais valjouffrey-000007
picto picto2

An interview with Bernard Bel and Médéric Gasquet-Cyrus (Radio Mont Aiguille, 16/9/12)

Le laboureur et ses enfants (Robert Bois, Etienne Champollion, Damien Roquetty)

Le temps des cerises (Robert Bois, Etienne Champollion, Damien Roquetty)
hdl:11041/sldr000787
2014-07-31
Version 1
源数据
Google earth
OpenStreetMap
• Conseil Régional Rhône-Alpes
语音库 ortolang-000894
Read speech in Italian L1 (Sandra CORNAZ)
Grenoble Images Parole Signal Automatique - UMR 5216 (Gipsa, Grenoble FR)
Laboratorio di Fonetica Sperimentale ’Arturo Genere’ dell’Università di Torino (LFSAG, Torino IT)

Env. 50 locuteurs de langue maternelle italienne. Enregistrements de trois types de lecture : phrases de type ’bene, Iris e Ugo, mangiamo una bella pesca’; texte de “Il Vento di tramontana e il sole“; phrases sans signification : ’V, hai detto V, V come in CV’.
Circa 50 locutori italiano lingua materna. Registrazioni di tre tipi di lettura : frasi di tipo ’bene, Iris e Ugo, mangiamo una bella pesca’; testo di “Il Vento di tramontana e il sole“; frasi senza senso : ’V, hai detto V, V come in CV’.


(phonetics, phonology, text_and_corpus_linguistics)
意大利语 (Italiano)
hdl:11041/ortolang-000894
2014-07-17
Version 1
源数据
Google earth
OpenStreetMap
工具 ortolang-000895
Script praat pour recueil infos acoustiques (Sandra CORNAZ)
Grenoble Images Parole Signal Automatique - UMR 5216 (Gipsa, Grenoble FR)

Script à utiliser à partir d’un TextGrid (en particulier généré sous SPPAS). Permet de récupérer les infos suivantes pour chaque partie segmentée : étiquette, durée, F0, F1, F2, F3, F4, et pour chacune la std et la bandw. Les mesures de formants sont calculées à partir de la médiane des valeurs recueillies toutes les 10 ms sur la partie segmentée. Ce script a été modifié pour [...]


(phonetics, computational_linguistics)
hdl:11041/ortolang-000895
2014-07-14
Version 1
源数据
Google earth
OpenStreetMap

This material is Open Data
语音库 sldr000892
La compétence pragmatique en négociation (Français Langue Etrangère par des Singapouriens, niveaux A2 et B1) (Isabel REPISO)
个人贡献

Two role plays have been proposed to the speakers, both in formal and casual contexts.


(language_acquisition, discourse_analysis, syntax)
法语 (français)
hdl:11041/sldr000892
2014-07-01
Version 1
源数据
语音库 alipe-000853
ALIPE (Acquisition de la Liaison et Interactions Parents Enfants) (Damien Chabanal, Thierry Chanier, Loïc Liégeois)
Laboratoire de Recherche sur le Langage - EA 999 (LRL, Clermont-Ferrand FR)

Interactions parents-enfant annotées pour l’étude de la liaison.
Ce corpus contient la transcription d’environ 15H de conversations informelles entre enfant et parents.
Les données de ce corpus ont été structurées dans le cadre du projet ALIPE (Acquisition de la Liaison et Interactions Parents Enfants) du Laboratoire de Recherche sur le Langage.


(language_acquisition, phonology)
法语 (français)

    hdl:11041/alipe-000853
    2014-05-19
    Version 1
    源数据
    • IRCOM
    • ORTOLANG
    <<  页 2  >>

    这个站点被宣称对委员会 Nationale de l'Informatique et des Libertés (CNIL) 根据在2008年3月26日的协议Nr.1222972。 根据法国法律,名义上被援引授予任何人通入对,修改、相对的数据更正和镇压他或她(艺术。34 “Informatique和Libertés”行动1978 1月6日)。 要施加您的权利,寄发一则消息到 webmaster(at)sldr.org

    This site is optimized for FireFox or any browser with the 'tabs' option set.