Hauptseite: Unterschied zwischen den Versionen

Aus Kobra
Wechseln zu: Navigation, Suche
 
(35 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 4: Zeile 4:
 
|-  
 
|-  
 
| style="background:#ffffff; padding:1em" |  
 
| style="background:#ffffff; padding:1em" |  
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).
+
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).
  
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].  
+
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].  
  
<span style= "color:#FF0000;">'''AKTUELL:'''</span>
+
<div style="clear: left"></div> Auf diesen Seiten finden Sie weitere Informationen über:
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']]  am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts.
 
 
 
Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen. Das aktuelle Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]].
 
 
 
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:
 
 
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''
 
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''
 
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''
 
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''
 
* '''[[Fallstudien|die Fallstudien des Projekts]]'''
 
* '''[[Fallstudien|die Fallstudien des Projekts]]'''
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''
+
*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften'' am 30.10.2015]]'''
 +
* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''
 +
|}
 +
 
 +
{| class="wikitable" width="99%"
 +
|-
 +
! <big> KobRA-Software </big>
 +
|-
 +
| style="background:#ffffff; padding:1em" |
 +
[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.
 
|}
 
|}
  
Zeile 26: Zeile 30:
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
  
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei. Das aktuelle Tagungsprogramm finden Sie [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]].
+
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].
  
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
 
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
  
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.
+
* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.
  
 
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
 
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
Zeile 40: Zeile 44:
 
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
 
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
  
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
 
 
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
 
 
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA]  auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.
 
 
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen'' (Thomas Bartz, Christian Pölitz, Angelika Storrer) [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015.
 
  
 
----
 
----
Zeile 55: Zeile 52:
 
{| class="wikitable" width="49%" style="float:left"
 
{| class="wikitable" width="49%" style="float:left"
 
|-
 
|-
! <big>Veröffentlichungen</big>
+
! <big>Veröffentlichungen und Dokumentationen</big>
 
|-
 
|-
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
 +
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
 +
 +
*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
 +
 +
* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
  
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
+
*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].
  
 
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015.  
 
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015.  
Zeile 72: Zeile 74:
  
 
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]
 
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]
 +
  
 
----
 
----

Aktuelle Version vom 24. März 2016, 12:49 Uhr

Herzlich willkommen
Kwic-kobra-2geo.png
KobRA-RM.png
KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wurde (Förderkennzeichen: 01UG1245A-E).

Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war Prof. Dr. Angelika Storrer (Universität Mannheim).

Auf diesen Seiten finden Sie weitere Informationen über:
KobRA-Software
Gnome-System-Software-Installer-48.png
Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: Software.
Die Installation und Anwendung der Komponenten ist im KobRA-Software-Handbuch (PDF) beschrieben.
Aktivitäten
  • Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015.
  • Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
  • Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.



Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen und Dokumentationen
  • Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
  • Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW. Technischer Bericht, BBAW. Online-Veröffentlichung (PDF).
  • Diewald, Nils; Kupietz, Marc (2016): Integration der KobRA-Verfahren in die IDS-Infrastrukturen. Technischer Bericht, IDS Mannheim Online-Veröffentlichung (PDF).
  • Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF
  • Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF)
  • Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF)



Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen