Aktivitäten

Aus Kobra
Version vom 15. Februar 2016, 12:28 Uhr von Weber (Diskussion | Beiträge) (Electronic Lexicography in the 21st Century: Linking lexical data in the digital age (elex), 11.-13. August 2015 (Herstmonceaux, UK))

Wechseln zu: Navigation, Suche

Auf dieser Seite finden Sie Meldungen zu Aktivitäten des KobRA-Projekts (absteigend chronologisch sortiert). Für einen schnellen Überblick bieten wir auch eine Auflistung aller projektrelevanten wissenschaftlichen Vorträge an: Präsentationen. Für die Workshops und Fallstudien des Projekts gibt es ebenfalls je eigenständige Rubriken: Projektworkshops, Fallstudien.


Inhaltsverzeichnis

KobRA-Fachtagung, 30. Oktober 2015, BBAW (Berlin)

Auf der Fachtagung Neue Wege in der Nutzung von Korpora - Data-Mining für die textorientierten Geisteswissenschaften wurden die Ergebnisse des KobRA-Projekts vorgestellt und Perspektiven für die Zukunft diskutiert. Das Tagungsprogramm finden Sie hier.

Die einzelnen Präsentationen finden Sie auf dieser Seite zum Download.

Connect, Animate, Innovate. TEI Annual Conference and Members' Meeting 2015, 28.-31. Oktober 2015 (Lyon)

Im Rahmen der Jahreskonferenz der Text encoding Initiative beteiligen sich verschiedene KobRA-Akteure an einem Panel zum Stand der Entwicklung eines TEI-Schemas für die Annotation von Korpora internetbasierter Kommunikation / sozialer Medien:

DCH2015, 28. bis 30. Oktober 2015 (Berlin)

Die interdisziplinäre Konferenz Digital Cultural Heritage (DCH) am 28. Oktober 2015 widmet sich der Auseinandersetzung mit kulturellem Erbe im Zeitalter der Digitalisierung. WissenschaftlerInnen diskutieren über digitale Analyse-, Auswertungs- und Darstellungsmöglichkeiten verschiedenener Disziplinen.

  • Beitrag: Vortrag A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources (Katharina Morik, Thomas Bartz, Christian Pölitz & Angelika Storrer).

International Research Days: Social Media and CMC Corpora for the eHumanities (ird-cmc), 23./24. Oktober 2015 (Rennes)

Im Rahmen der internationalen ird-cmc-Konferenz in Rennes, die von Michael Beißwenger mitorganisiert wird, gibt es verschiedene Beiträge mit KobRA-Bezug:

  • Keynote-Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer)
  • Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext)
  • Vortrag: "An extended tag set for annotating parts of speech in CMC corpora" (Michael Beißwenger, Thomas Bartz, Eric Ehrhardt, Angelika Storrer)

Electronic Lexicography in the 21st Century: Linking lexical data in the digital age (elex), 11.-13. August 2015 (Herstmonceaux, UK)

Die (seit 2009) zweijährlich stattfindende Konferenz elex bringt Praktiker aus der Lexikographie und Entwickler digitaler Werkzeuge für die Bearbeitung und Präsentation lexikographischer Daten zusammen. Das KobRA-Projekt war mit den unten stehenden Beiträgen auf dieser Fachtagung vertreten.

Beiträge:

  • Vortrag: "Using a Maximum Entropy Classifier to link “good” corpus examples to dictionary senses." (Alexander Geyken, Christian Pölitz, Thomas Bartz)
  • Vortrag: "Combining a rule-based approach and machine learning in a good-example extraction task for the purpose of lexicographic work on contemporary standard German." (Lothar Lemnitzer, Christian Pölitz, Jörg Didakowski, Alexander Geyken)

CLARIN-D Fach-AG Workshop, 30. Juni/1. Juli 2015 (Leipzig)

Beim dritten Workshop der CLARIN-D Fach-AGs "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" stehen digitale Forschungsressourcen, deren Pflege und Anwendungs- und Distributionspotential im Mittelpunkt. Der Workshop bietet die Möglichkeit, das KobRA-Projekt im Rahmen eines interdisziplinären Austausches vorzustellen und sowohl vielfältige Anwendungsmöglichkeiten der entwickelten Analyseverfahren aufzuzeigen als auch Forschungsdesiderate zu formulieren.

QueryVis Workshop (im Rahmen der NODALIDA), 11. Mai 2015 (Vilnius, Litauen)

Am 11. Mai fand im Rahmen der 20. Nordic Conference of Computational Linguistics (Nodalida 2015) der QueryVis Workshop on Innovative Corpus Query and Visualization Tools statt, mit Beteiligung von Marc Kupietz (als Invited Speaker) und Nils Diewald.

Beiträge:

  • Eingeladener Vortrag: "Scaling out corpus technology: the open source query and analysis engine KorAP." (Marc Kupietz)
  • Vortrag: "KoralQuery - A General Corpus Query Protocol." (Joachim Bingel & Nils Diewald)

Digital Humanities Summit, 3./4. März 2015 (Berlin)

Der "DARIAH-D Digital Humanities Summit" beschäftigte sich mit der zukünftigen Entwicklung digitaler Forschungsinfrastrukturen im Bereich der Kultur- und Geisteswissenschaften. Die Entwicklung von neuen, korpusbasierten Analysemethoden und Werkzeugen trägt zur Strärkung interdiziplinärer Zusammenarbeit bei und fördert die Vernetzung von Forschungsinfrastrukturen.

Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)

Ziel des Symposiums Visuelle Linguistik im Schloss Herrenhausen (Hannover) war es, den aktuellen Stand zu Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft zu erörten. Visualisierung hat als Mittel zur Veranschaulichung in der Linguistik eine lange Tradition, mit dem Aufkommen großer Korpora und der damit einhergehenden Etablierung statistischer, korpuslinguistischer Methoden hat das Thema in den letzten Jahren eine neue Relevanz bekommen und stellt heute eine große Entwicklungschance und Herausforderung zugleich dar.

CAC 2014, 23.-25. Oktober 2014 (Soesterberg)

Die CLARIN-Jahreskonferenz 2014 in Soesterberg (Niederlande) war eine gute Gelegenheit, bislang noch nicht präsentierte Ergebnisse der Projektarbeiten aus dem Anwendungsfeld Lexikographie und erstmals auch die im Projekt entwickelte bzw. angepasste Data-Mining-Umgebung für die korpus-basierte linguistische Recherche und Analyse als Ganze vorzustellen. Die Projektarbeiten bauen unmittelbar auf die CLARIN-Infrastruktur auf und erweitern die Möglichkeiten der Recherche und Analyse.

KONVENS 2014, 7. Oktober 2014 (Hildesheim)

Im Rahmen des Workshops NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media bei Konferenz zur Verarbeitung natürlicher Sprachen (KONVENS 2014) an der Universität Hildesheim haben wir mit unseren Kooperationspartnern vom IDS Mannheim laufende Arbeiten aus dem Projekt zur automatischen Identifikation und Klassifikation sprachlicher Besonderheiten in der internetbasierten Kommunikation vorgestellt. Die Datengrundlage für die Entwicklung und Evaluation der Verfahren bildete das Wikipedia-Korpus in DeReKo.

  • Beitrag: "Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning." Posterpräsentation im Rahmen des Workshops "NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media" bei der KONVENS 2014 (Michael Beißwenger, Harald Lüngen, Eliza Margaretha & Christian Pölitz)

Dritter Projekt-Workshop am 25./26. September 2014 (Mannheim)

Am 25./26.09.2014 fand an der Universität Mannheim das dritte Arbeitstreffen des Projekts statt. Im Vordergrund stand der Austausch über die bereits erreichten Projektziele der Entwicklungs- und Evaluationsphase sowie über die geplanten Arbeiten in der bevorstehenden Integrationsphase. Am ersten Workshoptag stellten Beteiligte aus allen Teilprojekten des Projektverbunds in öffentlichen Vorträgen bislang erzielte Ergebnisse und laufende Arbeiten vor. Der zweite Workshoptag diente der konkreteren internen Planung der nächsten Projektphase sowie der Abschlusstagung am 29./30. Oktober 2015 an der Akademie der Wissenschaften (BBAW).

4th General DARIAH VCC meeting, 17.-19. September 2014 (Rom)

Beim DARIAH-Meeting in Rom waren wir in Kooperation mit Kolleginnen und Kollegen aus der TEI-SIG "Computer-Mediated Comunication" an der Ausrichtung einer Community Session zum Thema "Models and tools for structuring & annotating corpora of social media / computer-­mediated communication" beteiligt. Im Rahmen dieser Veranstaltung haben wir erste Ergebnisse aus den Fallstudien im Bereich "Varietätenlinguistik / Internetbasierte Kommunikation" vorgestellt und mit Blick auf die Entwicklung von Standards für den Aufbau von Korpora internetbasierter Kommunikation diskutiert.

Beiträge:

EURALEX 2014, 15.-19. Juli 2014 (Bozen)

In ihrem Vortrag zur Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen im Rahmen des XVI. internationalen EURALEX-Kongresses, ausgerichtet an der Europäischen Akademie in Bozen (EURAC), gaben Jörg Didakowski und Nadja Radtke einen guten Einblick in die Fragestellungen und korpus-/technologie-basierten Ansätze im Anwendungsfeld diachronische Sprachforschung/Stützverbgefüge.

DH 2014, 7.-12. Juni 2014 (Lausanne)

Nach einem erfolgreich eingereichten Paper zu Ergebnissen aus dem Anwendungsfeld Lexikographie war das KobRA-Projekt auch auf der internationalen Jahreskonferenz der Alliance of Digital Humanities Organizations, Digital Humanities, in Lausanne präsent. Im Rahmen einer Posterpräsentation konnten wir in einen erkenntnisreichen Austausch mit Vertretern verwandter Projekte treten und interessante neue Kontakte knüpfen.

  • Beitrag: "Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining." Posterpräsentation im Rahmen der Digital Humanities 2014 in Lausanne (Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke, Angelika Storrer)

LaTeCH 2014, 26. April 2014 (Göteborg)

Die im Rahmen der Fallstudien im Anwendungsfeld Lexikographie bislang angewandten Verfahren wurden in einem Vortrag beim 8. Workshop Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014) vorgestellt. Der Workshop fand in Verbindung mit der 14. Jahrestagung des European Chapter of the Association for Computational Linguistics (EACL 2014) statt.

DHd 2014, 25.-28. März 2014 (Passau)

Das KobRA-Projekt war mit einer Posterpräsentation und einem Kurzvortrag im Rahmen des Poster-Slams bei der ersten Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum (DHd) in Passau vertreten. Vorgestellt wurden Projektergebnisse aus dem Anwendungsfeld Lexikographie, die in Zusammenarbeit mit dem Projektpartner an der Berlin-Brandenburgischen Akademie der Wissenschaften erzielt wurden.

"Social Media Corpora for the eHumanities", Februar 2014 (Dortmund)

Im Februar 2014 fand an der TU Dortmund die Abschlusstagung des DFG-Netzwerks Empirische Erforschung internetbasierter Kommunikation (Empirikom) statt. In die Tagung integriert war das zweite offizielle Arbeitstreffen der Special Interest Group "Computer-Mediated Communication" der Text Encoding Initiative (TEI), an dem mit Michael Beißwenger, Lothar Lemnitzer, Angelika Storrer und Andreas Witt KobRA-Vertreter aus Dortmund, Berlin und Mannheim mit Beiträgen beteiligt waren. Vorgestellt und diskutiert wurde u.a. der Entwurf zu einem Basisschema für die TEI-Repräsentation von Korpora internetbasierter Kommunikation (IBK), das geeignet ist, nicht nur Korpora zu rein schriftbasierten IBK-Genres, sondern auch Korpora mit Sprachdaten aus multimodalen Kommunikationsumgebungen zu repräsentieren.

Darüber hinaus stellten Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Swantje Westpfahl (IDS Mannheim) Erweiterungen zum "Stuttgart-Tübingen-Tagset" für das POS-Tagging deutscher Sprachdaten vor, die auf die Behandlung von Phänomenen in Sprachdaten internetbasierter Kommunikation abgestimmt sind und die auch in den Arbeiten in KobRA Verwendung finden werden. Ein Beitrag von Angelika Storrer zur Modellierung von Phänomenen "nichtstandardisierter" Schriftlichkeit bei der Sprachverwendung in sozialen Medien lieferte dazu einen theoretischen Beschreibungsrahmen.

Die Tagungsbeiträge mit KobRA-Bezug im Einzelnen:

  • "A Basic Schema for Modeling Computer-Mediated Communication in TEI" (Michael Beißwenger, Maria Ermakova, Thierry Chanier, Kun Jin, Lothar Lemnitzer und Angelika Storrer)
  • "General Requirements and Issues in Defining a TEI Schema for the Representation of Computer-Mediated Communication" (Michael Beißwenger)
  • "Relations and Options for Cooperation between the SIG 'TEI for Linguists' and the SIG 'Computer-Mediated Communication'" (Andreas Witt)
  • "Ein erweitertes STTS-Tagset für die POS-Annotation von Korpora gesprochener Sprache und von Korpora internetbasierter Kommunikation" (Thomas Bartz, Michael Beißwenger, Angelika Storrer und Swantje Westpfahl)
  • "Was ist eigentlich der Standard? Varietätenlinguistische Überlegungen zur Einordnung von interaktionsorientierter Schriftlichkeit als 'non-standard', 'standardfern' etc. (Angelika Storrer)
  • "Vorbereitung einer Shared Task zur automatischen linguistischen Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Werkstattbericht" (Michael Beißwenger, Sabine Bartsch, Stefan Evert und Kay-Michael Würzner)

TEI 2013, 2.-5. Oktober 2013 (Rom)

Mit der Ausrichtung eines Panels sowie eines Arbeitstreffens der neu gegründeten Special Interest Group (SIG) "Computer-Mediated Communication" war KobRA (vertreten durch Thomas Bartz, Michael Beißwenger und Angelika Storrer) an der diesjährigen Konferenz der Text Encoding Inidiative (TEI) in Rom beteiligt.

Gemeinsam mit Kooperationspartnern aus Deutschland, Frankreich, Italien und den Niederlanden wurden aktuelle Arbeiten zur Standardisierung von Schemata für die linguistische Annotation von Sprachdaten aus Genres internetbasierter Kommunikation präsentiert. Im Rahmen des von Michael Beißwenger & Lothar Lemnitzer organisierten Panels wurde anhand von Daten aus Korpus- und Forschungsprojekten zu verschiedenen europäischen Sprachen (für das Deutsche: Daten aus DeRiK und KobRA) ein Umriss sprachlicher und struktureller Besonderheiten internetbasierter Kommunikation präsentiert und wurden Herausforderungen und Möglichkeiten der automatischen und standardisierten Annotation solcher Phänomene in Korpora diskutiert.

Im Rahmen der von Michael Beißwenger koordinierten SIG wurden Schnittstellen zwischen laufenden Arbeiten in KobRA und DeRiK und vergleichbaren Arbeiten in Projekten zu anderen Sprachen identifiziert und Kooperationen in Hinblick auf die Erarbeitung von Lösungen für die automatische Annotation relevanter Phänomene vereinbart. Die Ergebnisse des Panels, der SIG und der vereinbarten Kooperationen fließen in die weitere Projektarbeit im Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation ein.

Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:

  • Three-Paper Panel: Computer-Mediated Communication in TEI: What Lies Ahead (organisiert von Michael Beißwenger & Lothar Lemnitzer mit Beiträgen von Michael Beißwenger, Thierry Chanier, Isabella Chiari, Maria Ermakova, Maarten van Gompel, Iris Hendrickx, Axel Herold, Henk van den Heuvel und Angelika Storrer)
  • Arbeitstreffen der SIG "Computer-Mediated Communication" (organisiert von Michael Beißwenger mit Beiträgen von Thomas Bartz, Angelika Storrer, Thierry Chanier, Isabella Chiari, Maria Ermakova und Iris Hendrickx)

GSCL 2013, 23.-27. September 2013 (Darmstadt)

Mit mehreren Einzelbeiträgen sowie der Ausrichtung eines Workshops haben VertreterInnen des KobRA-Projekts auf der International Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2013 laufende Arbeiten zur automatischen Analyse von Sprachdaten aus Genres internetbasierter Kommunikation und zur Nutzung von Informatikmethoden für die korpusgestützte Sprachanalyse präsentiert. Die Ergebnisse der Diskussionen im Rahmen des Workshops, der Postersession und des Kurzpaper-Format "GSCL-Kaleidoskop" fließen in die weitere Projektarbeit im Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation ein.

Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:

  • Workshop: Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation (organisiert von Michael Beißwenger und Angelika Storrer in Verbindung mit Anke Lüdeling (Berlin) und dem DFG-Netzwerk Empirikom)
  • "Vorbereitung einer Shared Task zur Verarbeitung von Sprachdaten aus Genres internetbasierter Kommunikation / Preparing a Shared Task on Linguistic Annotation of Computer-Mediated Communication." Vortrag und Posterpräsentation im Rahmen des GSCL-Kaleidoskop (Michael Beißwenger in Kooperation mit Stefan Evert, Kay-Michael Würzner und Sabine Bartsch)
  • "Domain Adaptation in Corpus Linguistics." Vortrag im Rahmen des GSCL-Kaleidoskop (Christian Pölitz)
  • "Modifikation und Erweiterung von STTS für die Annotation von Gesprächskorpora und von Korpora zu Genres internetbasierter Kommunikation." Vortrag im Rahmen des GSCL-Kaleidoskop (Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Ines Rehbein, Thomas Schmidt und Swantje Westpfahl)

GAL 2013, 19./20. September 2013 (Aachen)

Auf der 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V. (GAL 2013) haben die Dortmunder Projektmitarbeiter Thomas Bartz, Nadja Radtke und Christian Pölitz erste Ergebnisse der KobRA-Projektarbeiten zu den Aufgabenbereichen Klassifikation und Disambiguierung von Treffern bzw. Trefferlisten vorgestellt. Ausgangspunkt für den gemeinsamen Vortrag sind die Arbeiten im Anwendungsfeld Lexikographie, in die auch Ergebnisse und Anregungen aus der Sektionsarbeit unmittelbar einfließen.

Beiträge aus der Sektion "Lexikographie":

  • Vortrag: "Bereinigen, Disambiguieren, Visualisieren: Möglichkeiten der Unterstützung der korpusbasierten Lexikographie durch Data-Mining-Verfahren" (Thomas Bartz, Nadja Radtke & Christian Pölitz sowie die Kollegen der BBAW)
  • Vortrag: "Extraktion guter Belege aus gegenwartssprachlichen Korpora und deren lexikographische Bewertung - Möglichkeiten und Grenzen" (Isabel Fuhrmann, Alexander Geyken, Lothar Lemnitzer, Norbert Schrader)

IDT 2013, 29. Juli bis 3. August 2013 (Bozen)

Mit zwei Einzelvorträgen und einem Posterstand haben Nadja Radtke und Thomas Bartz KobRA auf der XV. Internationalen Tagung der Deutschlehrerinnen und Deutschlehrer (IDT 2013) in Bozen vertreten und potenzielle Anwender aus den Bereichen Schule und Lehrerbildung als Multiplikatoren für die Aufgaben und Lösungen des Projekts gewinnen können.

In ihrem Vortrag in der Sektion "Wortschatz und Phraseologie" zeigte Nadja Radtke typische Bereinigungs- und Klassifikationsaufgaben, die sich beim korpus-basierten Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen im Rahmen ihres Dissertationsprojektes gestellt haben, und für die KobRA-Lösungen entwickelt werden.

Thomas Bartz stellte in seinem Vortrag in der Sektion "Korpora im Sprachunterricht" Möglichkeiten und Grenzen des Einsatzes aktuell existierender digitaler Sprachressourcen im Deutschunterricht sowie zu erwartende Verbesserungen durch KobRA-Lösungen vor.

Nadja Radtke und Thomas Bartz präsentierten im Rahmen einer sektionsübergreifenden Posterpräsentation Möglichkeiten der Nutzung deutschsprachiger Onlinekorpora im Unterricht und neue Potenziale für diesen Anwendungsbereich, die sich durch die KobRA-Projektarbeiten ergeben.

Der direkte Kontakt zu Nutzern von Korpora und Sprachressourcen in Lehr-/Lernkontexten brachte wichtige Anregungen insbesondere für die Anwendungsfelder Lexikographie und Diachronische Sprachforschung.

Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:

  • "Konzeption und korpusbasierter Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen." Vortrag im Rahmen der Sektion "Wortschatz und Phraseologie" (Nadja Radtke)
  • "Digitale Sprachressourcen im Deutschunterricht: Korpus-basierte Recherche und Analyse in der "Wörterbuchwerkstatt"." Vortrag im Rahmen der Sektion "Korpora im Sprachunterricht" (Thomas Bartz)
  • "Nutzung deutschsprachiger Onlinekorpora im Unterricht." Ausgewählter Beitrag der Sektion "Korpora im Sprachunterricht" für die sektionsübergreifende Posterpräsentation "Agorá" (Thomas Bartz & Nadja Radtke)

Zweiter Projekt-Workshop am 18./19. April 2013 (Dortmund)

Am 18./19.04.2013 fand an der TU Dortmund das zweite Arbeitstreffen des Projekts statt. Neben einer Einführung in RapidMiner, die von Prof. Dr. Katharina Morik angeboten wurde, standen dabei auch die Werkstattberichte der Projektpartner sowie die Dortmunder Werkstattberichte auf dem Programm. Das Ziel des zweiten Arbeitstreffens war u.a. das Verabschieden der Aufgabenliste sowie das Festlegen des Meilensteins 1.

Kick-off-Treffen der BMBF-Projektverbünde, 8./9. April 2013 (Leipzig)

Am 8./9. April 2013 fand an der Universität Leipzig das Kick-off-Treffen der 24 Projektverbünde statt, die im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities vom BMBF gefördert werden. Bei diesem Treffen wurde KobRA - wie auch die anderen 24 Projekte - im Rahmen einer Posterpräsentation vorgestellt.

Kick-off-Meeting der KobRA-Partner am 15./16. November 2012 (Dortmund)

Am 15./16.11.2012 fand im Erich-Brost-Haus der TU Dortmund das erste Arbeitstreffen des Projekts statt. Neben einem Überblick über Ziele und Fragestellungen sowie einer Vorstellung von Ressourcen und Verfahren in KobRA standen dabei auch Vorträge eingeladener Gastwissenschaftler auf dem Programm.