Projektbeschreibung/Genutzte Ressourcen

Aus Kobra
Wechseln zu: Navigation, Suche

Kobrabar.jpg

KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)
ist ein Verbundprojekt, das vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wird. Das Projekt wird seit September 2012 mit einer Laufzeit von 3 Jahren gefördert.

  • Beteiligte Disziplinen: Germanistische Sprachwissenschaft / Informatik / Computerlinguistik (s. Projektbeteiligte)
  • Methoden und Anwendungsbereich: Data-Mining-Methoden zur Verbesserung der korpus-basierten Recherche und Analyse in großen strukturierten Textkorpora (mit Schwerpunkt auf Deutsch als Untersuchungssprache)
  • Koordination: Prof. Dr. Angelika Storrer (TU Dortmund)

Die folgenden Seiten bieten einen Überblick über Anwendungsfelder, Methode und Ressourcen des Projekts:

Kobrabar.jpg

Wissenschaftliche Anwendungsfelder Kobradot.jpg Methode Kobradot.jpg Genutzte Ressourcen Kobradot.jpg Entstehende Ressourcen

Kobrabar.jpg

Genutzte Ressourcen

Verfahren: Die am Lehrstuhl für künstliche Intelligenz der TU Dortmund entwickelten Softwaresysteme SVMlight und RapidMiner befinden sich weltweit im Einsatz und werden auch für die Entwicklung innovativer Verfahren im vorliegenden Projekt genutzt. Bei beiden Systemen handelt es sich um für wissenschaftliche Zwecke frei verfügbare und erweiterbare Software (ggf. nach Rücksprache mit den Herausgebern).

Daten: Datengrundlage für die Lernverfahren und linguistischen Fallstudien sind strukturierte, linguistisch annotierte große Korpora/Baumbanken und lexikalische Ressourcen, die von den Sprachtechnologie-Partnern bereitgestellt werden und über Abfragewerkzeuge und/oder Webservices in CLARIN-D zur Verfügung stehen. Die folgende Tabelle gibt einen Überblick über diese Sprachressourcen und ihre Merkmale:

Kobra-ressourcen.jpg

Kobrabar.jpg

Wissenschaftliche Anwendungsfelder Kobradot.jpg Methode Kobradot.jpg Genutzte Ressourcen Kobradot.jpg Entstehende Ressourcen

Kobrabar.jpg