DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | von Luck, Kai | - |
dc.contributor.author | Herzberg, Andy | |
dc.date.accessioned | 2020-09-29T14:56:48Z | - |
dc.date.available | 2020-09-29T14:56:48Z | - |
dc.date.created | 2019 | |
dc.date.issued | 2019-02-12 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12738/8606 | - |
dc.description.abstract | Seit mehreren Jahrzehnten werden umfassend Merkmale erforscht, die gut lesbaren Text ausmachen. Der Fokus dieser Studien liegt meist auf der Klassifikation von Lesematerial für geeignete Schulstufen oder Bildungsgrade beim Fremdsprachenerwerb. Anders als die bisherigen Studien untersucht die vorliegende Arbeit die oberflächlichen Textmerkmale, die einen Einfluss auf menschlich kuratierten Qualitätsjournalismus haben. Da sich kaum Studien mit diesem Schwerpunkt auf die deutsche Sprache konzentrieren, soll diese Arbeit dazu beitragen die Forschungslücke zu schließen. Zu diesem Zweck wird eine deutschsprachige Textsammlung mit preisgekrönten Reportagen aufgebaut und nach der Extraktion der Merkmale mittels Machine Learning Verfahren untersucht. Mit traditionellem Feature Engineering wurde ohne Parameter- Tuning eine Klassifikationsgenauigkeit von circa 70% erreicht. Googles Cloud-Produkt „AutoML“, ein selbstlernendes neuronales Netz, erreichte sogar eine Klassifikationsgenauigkeit von 82%. Die Ergebnisse zeigen, dass es oberflächliche Textmerkmale gibt, die preisgekrönte Reportagen ausmachen und die für diverse Anwendungsbereiche genutzt werden können. | de |
dc.description.abstract | For several decades the characteristics that make up well-written texts have been researched extensively. The focus of these studies is mostly the classification of texts suitable for different school grades or second language acquisition. In contrast to previous studies, this paper examines the formal superficial features that influence humanly curated quality journalism. Since few studies focus on the German language, this paper contributes to close this gap in research. Therefore a corpus of award-winning German reportages will be built and, after feature extraction, examined by machine learning algorithms. With traditional feature engineering, a classification accuracy of about 70% can be achieved without parameter tuning. Google's cloud product "AutoML", a self-learning neural network, even achieves a classification accuracy of 82%. The results show that there are formal superficial text features that constitute quality journalism and might be used for miscellaneous applications. | en |
dc.language.iso | de | de |
dc.rights.uri | http://rightsstatements.org/vocab/InC/1.0/ | - |
dc.subject.ddc | 004 Informatik | |
dc.title | Analyse der oberflächlichen Merkmale von Qualitätsjournalismus-Texten | de |
dc.type | Thesis | |
openaire.rights | info:eu-repo/semantics/openAccess | |
thesis.grantor.department | Department Informatik | |
thesis.grantor.place | Hamburg | |
thesis.grantor.universityOrInstitution | Hochschule für angewandte Wissenschaften Hamburg | |
tuhh.contributor.referee | Tiedemann, Tim | - |
tuhh.gvk.ppn | 1048943038 | |
tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-86088 | - |
tuhh.note.extern | publ-mit-pod | |
tuhh.note.intern | 1 | |
tuhh.oai.show | true | en_US |
tuhh.opus.id | 4530 | |
tuhh.publication.institute | Department Informatik | |
tuhh.type.opus | Masterarbeit | - |
dc.subject.gnd | Text Mining | |
dc.type.casrai | Supervised Student Publication | - |
dc.type.dini | masterThesis | - |
dc.type.driver | masterThesis | - |
dc.type.status | info:eu-repo/semantics/publishedVersion | |
dc.type.thesis | masterThesis | |
dcterms.DCMIType | Text | - |
tuhh.dnb.status | domain | - |
item.creatorGND | Herzberg, Andy | - |
item.fulltext | With Fulltext | - |
item.creatorOrcid | Herzberg, Andy | - |
item.grantfulltext | open | - |
item.cerifentitytype | Publications | - |
item.advisorGND | von Luck, Kai | - |
item.languageiso639-1 | de | - |
item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
item.openairetype | Thesis | - |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
20181219_Masterarbeit_Andy_Herzberg.pdf | 3.52 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.