Hauptseite: Unterschied zwischen den Versionen

Version vom 3. November 2015, 19:12 Uhr

Herzlich willkommen
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining) ist ein Verbundprojekt, das seit September 2012 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wird (Förderkennzeichen: 01UG1245A). Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist Prof. Dr. Angelika Storrer (Universität Mannheim). Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über: die Ziele, Fragestellungen und Methoden des Projekts die beteiligten Personen und Forschungseinrichtungen die Fallstudien des Projekts sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).

Aktivitäten
Auf der Fachtagung Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm finden Sie hier. Die einzelnen Präsentationen werden in Kürze auf dieser Website zur Verfügung gestellt. Vortrag A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage am 28.-30. Oktober 2015 in Berlin. Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication" im Rahmen der Jahreskonferenz der Text encoding Initiative stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt. Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015. Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015. Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer. Paper auf der Internationalen Fachtagung eLexicography 2015: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionariesIn: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015. Paper auf der Internationalen Fachtagung eLexicography 2015: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015. Vortrag Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA auf dem CLARIN-D Workshop Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen am 30.6/1.7. in Leipzig. Posterpräsentation Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen (Thomas Bartz, Christian Pölitz, Angelika Storrer) auf dem Digital Humanities Summit, Berlin, 3./4. März 2015. Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen
NEU: Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins. PDF Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13. Bingel, Joachim; Diewald, Nils (2015): KoralQuery – a General Corpus Query Protocol. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. Diewald,Nils; Bingel, Joachim (2015): KoralQuery 0.3. Technical Report, Working draft. IDS, Mannheim, Germany. Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining. Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations, Universität Lausanne, 10. Juli 2014 Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF) Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF) Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen

@@ Zeile 21: / Zeile 21: @@
 | style="background:#ffffff; padding:1em" |
-*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]]. Die einzelnen Präsentationen werden in Kürze zur Verfügung gestellt.
+*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]]. Die einzelnen Präsentationen werden in Kürze auf dieser Website zur Verfügung gestellt.
 *Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.

Hauptseite: Unterschied zwischen den Versionen

Version vom 3. November 2015, 19:12 Uhr

Navigationsmenü

Ansichten

Meine Werkzeuge

Projekt KobRA:

Wiki:

Suche

Werkzeuge