Hauptseite: Unterschied zwischen den Versionen

Aus Kobra
Wechseln zu: Navigation, Suche
Zeile 21: Zeile 21:
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
  
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]]. Die einzelnen Präsentationen werden in Kürze zur Verfügung gestellt.
+
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]]. Die einzelnen Präsentationen werden in Kürze auf dieser Website zur Verfügung gestellt.
  
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.

Version vom 3. November 2015, 18:12 Uhr

Herzlich willkommen
Kwic-kobra-2geo.png
KobRA-RM.png
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining) ist ein Verbundprojekt, das seit September 2012 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wird (Förderkennzeichen: 01UG1245A).

Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist Prof. Dr. Angelika Storrer (Universität Mannheim).

Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:
Aktivitäten
  • Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015.
  • Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
  • Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
  • Paper auf der Internationalen Fachtagung eLexicography 2015: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionariesIn: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
  • Paper auf der Internationalen Fachtagung eLexicography 2015: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
  • Posterpräsentation Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen (Thomas Bartz, Christian Pölitz, Angelika Storrer) auf dem Digital Humanities Summit, Berlin, 3./4. März 2015.

Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen
  • NEU: Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins. PDF
  • Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
  • Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF
  • Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF)
  • Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF)

Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen