WebLicht als korpuslinguistisches Analyseinstrument für studentische Forschungsarbeiten
am Beispiel von vorwissenschaftlichen Arbeiten
DOI:
https://doi.org/10.48646/zisch.200303Schlagworte:
Korpuslinguistik, Wissenschaftssprache, WebLicht, Methoden in der SchreibwissenschaftAbstract
Für die Analyse großer Datenmengen von gesprochener oder geschriebener Sprache bietet das Forschungsfeld der Korpuslinguistik viele Möglichkeiten: Einzelne Elemente natürlicher Sprachen können untersucht werden, aber auch eine Analyse der Gesamtstruktur der Sprache ist möglich. Liegen Sprachdenkmäler in digitalisierter Form vor, so können auch jene Gegenstand einer korpusbasierten Analyse sein. Die Untersuchungen am Korpus führen dazu, dass durch Rückschlüsse neue Theorien gebildet werden und darauf aufbauend neue Erkenntnisse erlangt werden. So auch die korpusbasierte Untersuchung der Autor*innen Cordula Meißner und Franziska Waller, welche versucht haben, das Repertoire an sprachlichen Formulierungen in geisteswissenschaftlichen Fachdisziplinen abzubilden, um so festzustellen, welche Elemente der alltäglichen Wissenschaftssprache angehören und wo Überlappungen zwischen den einzelnen Disziplinen vorkommen.
Liegt der Fokus nun aber nicht auf den Ergebnissen einer solchen Korpusanalyse, sondern vielmehr auf der technischen Umsetzung, gibt es einiges zu beachten: von der Gewinnung der Rohdaten über die Bereinigung und Konvertierung bis hin zur Auszeichnung der Daten mit Metadaten. Exakt jene Schritte werden in nachfolgenden Artikel beleuchtet, wobei es darum geht aufzuzeigen, welche Möglichkeiten das Open-Source-Softwareprogramm WebLicht für die Auseinandersetzung mit linguistischen Fragestellungen bietet und was es dabei zu beachten gilt.
Downloads
Veröffentlicht
Zitationsvorschlag
Ausgabe
Rubrik
Lizenz
Copyright (c) 2020 Andrea Steiner-Cardell
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung - Nicht-kommerziell 4.0 International.
Sofern nicht anders angegeben, sind die Inhalte dieses Journals lizenziert unter einer Creative Commons Namensnennung - Keine Bearbeitungen 4.0 International Lizenz. Das Copyright bleibt bei den Autor*innen.