Abstracts

Plenarvorträge / Plenaries

Menschen und Maschinen.
Neue Entwicklungen in der digitalen Kommunikation
Prof. Dr. Christa Dürscheid
Universität Zürich / University of Zurich

Linguistische Arbeiten zur digitalen Kommunikation haben mittlerweile eine gewisse Tradition; sie reichen zurück bis in die 1980er Jahre. Lange Zeit lag dabei der Schwerpunkt auf der Frage, welche Ausdrucksmittel in der schriftlich-digitalen Interaktion eingesetzt werden. Derzeit vollzieht sich hier ein Wandel: In den Fokus der Forschung rückt nun zum einen mehr und mehr die mündlich-digitale Kommunikation (z.B. via Sprachnachrichten oder in Videosequenzen), zum anderen die Kommunikation mit Maschinen. Zu Letzterem zählt sowohl das Sprechen mit Robotern als auch mit virtuellen Assistenzsystemen – beides fällt in der Forschung zur Mensch-Maschine-Kommunikation unter den Oberbegriff „Maschine“. Mit virtuellen Assistenzsystemen kommuniziert man beispielsweise, wenn man zuhause das Licht, die Heizung oder den Fernseher über Sprachbefehle steuert, wenn man eine Kundendiensthotline anruft oder mit Siri am Handy „spricht“. Roboter werden eingesetzt in der Altenpflege, in Einkaufszentren, als Museumsführer oder an der Rezeption von Hotels. Roboter haben aber anders als digitale Assistenzsysteme eine physische Gestalt, sie können also in beschränktem Maße auch non-verbal (z.B. über Arm- und Kopfbewegungen), nicht nur verbal kommunizieren. Wie aktuelle Studien zeigen, nimmt der Einsatz von sozialen Robotern auch in Europa stetig zu; insbesondere in der Altenpflege gibt es verschiedene Bereiche, in denen sie zum Einsatz kommen. Ein bekanntes Beispiel für einen solchen Roboter ist Pepper, der ca. 120 cm groß ist und auf einem fußähnlichen Sockel steht.

Im Vortrag werde ich in einem Überblick die Geschichte der linguistischen Forschung zur digitalen Kommunikation nachzeichnen und dabei den Schwerpunkt auf solche Arbeiten legen, die die deutsche Sprache in den Blick nehmen. Den Vortrag gliedere ich, der Historie folgend, in drei Etappen: Im ersten Teil thematisiere ich wichtige Erkenntnisse aus der frühen Forschung zur E-Mail-, SMS- und (Text-)Chatkommunikation, dann gehe ich auf neuere Arbeiten zur audio- und videobasierten Kommunikation via Computer ein. Der dritte Teil des Vortrags ist der Mensch-Maschine-Kommunikation gewidmet. Auch in diesem Teil steht die mündlich-digitale Kommunikation im Vordergrund, wobei sich hier aber die Frage stellt, ob im eigentlichen Sinne von einem Dialog gesprochen werden kann. Ist es nicht vielmehr so, dass wir zwar mit Maschinen sprechen (so z.B. mit Siri) und die Maschinen mit uns sprechen (so z.B. Pepper mit der Kundschaft im Einkaufszentrum), dass diesem Sprechen aber grundlegende Eigenschaften fehlen, die aus dem Sprechen einen Dialog machen? Damit zusammen hängt natürlich die Frage, welche Voraussetzungen erfüllt sein müssen, damit aus einer digitalen Kommunikation (ob mündlich oder schriftlich) ein Dialog wird. Auf diesen Aspekt werde ich zum Schluss des Vortrags eingehen und zeigen, dass es die Reflexivität, d.h. die wechselseitige Bezugnahme der Kommunikationspartner aufeinander ist, die als fundamentales dialogisches Prinzip angesehen werden kann. Inwiefern dieses Prinzip in der Mensch-Maschine-Kommunikation umgesetzt wird, ist die Frage. Diese Frage stellt sich allerdings, wenn auch auf gänzlich anderer Ebene, auch mit Blick auf die Mensch-Mensch-Kommunikation.

————-

Wie Migration die deutsche Sprache verändert

em. Prof. Dr. Uwe Hinrichs
Universität Leipzig / Leipzig University

Die deutsche gesprochene Sprache verändert sich unter dem Einfluss vieler Migrantensprachen heue schneller als früher. Es sind besonders die Mehrsprachigkeiten in den großen Städten, die hier einen massiven Einfluss produzieren. Da sind erstens die vielen Mischsprachen, also z.B. türkisch-deutsch, arabisch-deutsch, russisch-deutsch, serbokroatisch-deutsch, in denen im Alltag geswitcht wird, und die einen Verlust an grammatischer Korrektheit produzieren. Zum anderen ist es das, was man eine mentale Mehrsprachigkeit nennen könnte, also die gleichzeitige Beherrschung und meist sozial geregelte Anwendung mehrerer oder vieler Sprachen: viele sprechen ihre Herkunftssprache, dann Deutsch, Englisch und oft noch eine vierte Sprache. Beide Typen von neuer Mehrsprachigkeit wirken sich auch auf die Sprache des Gastlandes, also Deutschland, aus. Das gesprochene Deutsch der Deutschen ohne Migrationsgeschichte weist in allen Bereichen Veränderungen auf: Kasus schwanken (mit den Problem), desgleichen die Syntax (ich habe Vertrauen für meinen Lehrer), und sogar die Standardphonetik scheint hier und da angegriffen. Ein besonderes Kapitel ist die Kopie migrantischer Konstruktionen ins Deutsche (neue lexikalische Muster vom Typ Protest machen für protestieren). Geklärt werden soll in der Diskussion, ob der Einfluss von Migrantensprachen eher unter- oder überschätzt wird.

Literatur
Uwe Hinrichs: Multi Kulti Deutsch. Wie Migration die deutsche Sprache verändert. München 2013. Verlag C.H. Beck.

————-

Corpus Linguistics for the Future
Current opportunities, challenges and approaches in corpus linguistics viewed from a Mannheim perspective

Dr. Marc Kupietz
Leibniz-Institut für Deutsche Sprache (IDS) / Leibniz Institute for the German Language (IDS)

In the last decades, corpus linguistics has established itself in so many linguistic sub-disciplines and to such an extent that one might almost be inclined to regard corpus linguistics and linguistics as synonymous. Also, the creation of very large or specialized corpora no longer seems to pose too much of a challenge, given the ever-growing volume of digital texts – whether they are available on the internet or only on publishers’ servers – and the increasing number of printed texts being digitized by public institutions or technology giants like Google. Even some of the long-notorious legal obstacles to the comprehensible analysis and the sharing of corpora in the EU were removed last year with the national establishments of EU directive 2019/790 on copyright and related rights in the Digital Single Market and the extension of the so-called text and data mining exceptions (Kamocki et al. 2018, 2022). In view of these developments, a prosperous future seems to lie ahead for linguistics empirically grounded in large and diverse corpora.

However, a few problems remain and some new ones have arisen. A fundamental challenge remains the question of which population a corpus is sufficiently representative of, with regard to a particular question, or in other words, which more general linguistic conclusions can be extrapolated from corpus findings (Kupietz 2016, Koplenig 2017). While it is true that with very large web-based corpora, linguistically interesting constructions will be found more frequently and can thus be investigated in the first place, it is then often unclear to what extent and for what language domain the results are generalisable, as metadata is difficult to determine and therefore often not available in web-based corpora. So the situation can be a bit like having many examples of interesting football results, without knowing who played against whom and when.

Moreover, in order to build large corpora, whether web-based or not, with feasible effort, the use of heuristics is inevitably necessary (Perkuhn et al. 2012). This also applies to linguistic annotations, for which not even the best heuristic tool can be used if it is too slow. This means that with large corpora, both in the recorded observed data and in their recorded interpretations, a large absolute number of errors is to be expected (e.g. with an error rate of only 1% and a corpus size of 50 billion words, 500 million errors). Furthermore in a recent empirical study based on publications in four major corpus linguistics journals from 2009 and 2019, Larsson et al. (2022) have shown that an increased use of statistical reporting has not only complemented but to some degree also displaced qualitative linguistic interpretations.

In my talk, I will briefly exemplify the above-mentioned current challenges and present the approaches to solving them adopted by the corpus linguistics group at IDS Mannheim. These approaches include, for example, custom tailored virtual corpora (Kupietz et al. 2010), multiple concurring annotations (Belica et al. 2011), and interactive visualizations (Keibel et al. 2009, Perkuhn/Kupietz 2018). I will argue for a holistic view of (corpus) linguistics that incorporates aspects of corpus building, research tools and also infrastructural aspects, as a prerequisite for sustainable progress in the field, not displacing classical qualitative interpretations, but on the contrary, significantly improving their conditions.

References
Belica, Cyril/Kupietz, Marc/Witt, Andreas/Lüngen, Harald (2011): The Morphosyntactic Annotation of DeReKo: Interpretation, Opportunities, and Pitfalls. In: Konopka, Marek/Kubczak, Jacqueline/Mair, Christian/Šticha, František/Waßner, Ulrich Hermann (eds.): Grammar and Corpora 2009. Third International Conference. (= Corpus Linguistics and Interdisciplinary Perspectives on Language 1). Tübingen: Narr. 451-469.
Kamocki, Paweł/Ketzan, Erik/Wildgans, Julia/Witt, Andreas (2018): New exceptions for Text and Data Mining and their possible impact on the CLARIN infrastructure. In: Skadina, Inguna/Eskevich, Maria (eds.): CLARIN Annual Conference 2018, Proceedings. 8-10 October 2018, Pisa, Italy. Utrecht: Clarin. 39-42.
Kamocki, Paweł/Witt, Andreas (2022): Was darf die sprachwissenschafltiche Forschung? Juristische Fragen bei der Arbeit mit Sprachdaten. In: Beißwenger, Michael/Lemnitzer, Lothar/Müller-Spitzer, Carolin (eds.): Forschen in der Linguistik. Eine Methodeneinführung für das Germanistik-Studium. Paderborn: Brill/Fink. 277-291.
Keibel, Holger/Kupietz, Marc (2009): Approaching grammar: Towards an empirical linguistic research programme. In: Minegishi, Makoto/Kawaguchi, Yuji (Eds.): Working Papers in Corpus-based Linguistics and Language Education, No. 3. Tokyo: Tokyo University of Foreign Studies (TUFS). 61-76.
Koplenig, Alexander (2017): Against statistical significance testing in corpus linguistics. In: Corpus Linguistics and Linguistic Theory. Berlin: de Gruyter. 1-26.
Kupietz, Marc (2016): Constructing a Corpus. In: Durkin, Philip: The Oxford Handbook of Lexicography. (= Oxford handbooks in linguistics). Oxford: OUP. 62-75.
Larsson, Tove/Egbert, Jesse/Biber, Douglas (2022): On the status of statistical reporting versus linguistic description in corpus linguistics: A ten-year perspective. Corpora 17(1). Edinburgh University Press, 137–157.
Perkuhn, Rainer/Keibel, Holger/Kupietz, Marc (2012): Korpuslinguistik. (= UTB 3433). Paderborn: Fink.
Perkuhn, Rainer/Kupietz, Marc (2018): Visualisierung als aufmerksamkeitsleitendes Instrument bei der Analyse sehr großer Korpora. In: Bubenhofer, Noah/Kupietz, Marc (eds.): Visualisierung sprachlicher Daten. Visual Linguistics – Praxis – Tools. Heidelberg: Heidelberg University Publishing. 63-90.

————-

Zusätzlich zu den Plenarvorträgen werden auch Sektionsvorträge präsentiert. Das Abstractheft finden Sie unten.

In addition to the plenary speakers, there will be section papers. The book of abstracts can be found below.

Abstracts