english version - version española

Das Cespla ist ein linguistisches Corpus spanischsprachiger Gesprächsaufnahmen und deren Transkriptionen aus dem Gebiet des Río de la Plata (Argentinien und Uruguay). Das Corpus ist halböffentlich und kann für verschiedene wissenschaftliche Untersuchungen genutzt werden.

Daten

Charakteristisch für die aufgezeichneten Alltagsgespräche ist, ein sehr hohes Maß an Spontaneität und Authentizität. Die Sprecher befinden sich in ihnen vertrauten Situationen, mit (mehr oder weniger) vertrauten Personen und sind kaum vom Umstand des „Aufgenommenwerdens“ beeinflusst.

Die Aufnahmen entstanden in den Jahren von 2006 bis 2008 vor allem in La Plata und teilweise in Buenos Aires (Capital Federal). Die Sprecher sind im Alter von 22 bis 65 Jahren. Eine Erweiterung um Aufnahmen aus Montevideo und um solche mit jüngeren Sprechern ist geplant.

Das Korpus umfasst bislang 103 Aufnahmen mit einer Gesamtdauer von insgesamt 108 Stunden. Die Klangqualität der Aufnahmen reicht von gut bis sehr gut, bedingt durch die Aufnahmesituation.

Die Transkriptionen liegen in alignierter Form vor. Dies bedeutet, dass zusätzlich zur Umschrift auch die Zeitinformation über den Beginn und das Ende jedes Sprechbeitrages (Intonationsphrase) erfasst wurde. Dies ermöglicht es, von durchsuchbaren Transkripten direkt auf die entsprechende Stelle in der Aufnahme zurückzugreifen.

Zur Zeit sind ca. 10 Stundnen durchgängig transkribiert und darüber hinaus einzelne Teile in verschiedenen Aufnahmen. Angestrebt wird eine durchgägnige Transkription nach dem „Gesprächsanalytischen Transkriptionssystem“ (Selting et al. 1998)..

Technik

Die Daten des Korpus sind kompatibel zu den gebräuchlichsten Annotationswerkzeugen wie Praat, Elan, Exmaralda, Transana u.a. Die Integration in Datenbanken wie [moca], Microsoft Access und den Transformer ist ebenfalls gegeben.

Untersuchungen

Das Corpus eignet sich vor allem für linguistische Analysen spontaner Alltagssprache. Bisher entstehen Arbeiten in den Bereichen Gesprächsanalyse und interaktionale Linguistik. Das Corpus ist jedoch auch für andere Fragestellungen geeignet. Als Zielgruppe des Corpus sind vor allem kleinere und mittlere Forschungsprojekte anvisiert (Seminar-, Bachelor-, Master-, und Zulassungsarbeiten oder Promotionen).

Nutzungsbedingungen

Es handelt sich um ein halböffentliches Korpus. Über die Nutzungsbedingungen wird in jedem Fall einzeln entschieden, entsprechend der Ausrichtung der geplanten Studie. Dies dient dazu, thematische Überschneidungen mit laufenden Untersuchungen zu vermeiden. Generell gilt, dass Nutzer des Korpus einen Beitrag zum Fortschritt der Transkription des Korpus leisten.

Herausgeber

Oliver Ehmer

Kontakt

Albert-Ludwigs-Universität Freiburg
Romanisches Seminar
Werthmannplatz 3
D-79085 Freiburg

homepage: http://www.romanistik.uni-freiburg.de/ehmer

email: oliver.ehmer@romanistik.uni-freiburg.de