Hauptseite: Unterschied zwischen den Versionen

Aus Kobra
Wechseln zu: Navigation, Suche
Zeile 26: Zeile 26:
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
  
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei. Das aktuelle Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]].
+
*Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei. Das aktuelle Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]].
  
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.

Version vom 2. November 2015, 11:51 Uhr

Herzlich willkommen
Kwic-kobra-2geo.png
KobRA-RM.png
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining) ist ein Verbundprojekt, das seit September 2012 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wird (Förderkennzeichen: 01UG1245A).

Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist Prof. Dr. Angelika Storrer (Universität Mannheim).

AKTUELL: Auf der Fachtagung Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften am 30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW) in Berlin informieren wir über die Ergebnisse unseres Projekts.

Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen. Das aktuelle Tagungsprogramm finden Sie hier.

Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:
Aktivitäten
  • Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015.
  • Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
  • Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
  • Paper auf der Internationalen Fachtagung eLexicography 2015: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionariesIn: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
  • Paper auf der Internationalen Fachtagung eLexicography 2015: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
  • Posterpräsentation Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen (Thomas Bartz, Christian Pölitz, Angelika Storrer) auf dem Digital Humanities Summit, Berlin, 3./4. März 2015.

Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen
  • NEU: Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins. PDF
  • Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
  • Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF
  • Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF)
  • Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF)

Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen