Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorNitsche, Matthias
dc.date.accessioned2020-09-29T13:31:35Z-
dc.date.available2020-09-29T13:31:35Z-
dc.date.created2016
dc.date.issued2016-06-28
dc.identifier.urihttp://hdl.handle.net/20.500.12738/7413-
dc.description.abstractFür eine Maschine ist es schwer, ohne die Supervision eines menschlichen Expertens Text zu interpretieren. Techniken des Text Minings und Clustern als Ansatz von unsupervisierten Lernen, um Text aus Zeitungen in Kategorien und zu Ereignissen in der realenWelt zu gruppieren, ist im Mittelpunkt dieser Arbeit. Zusätzlich wurde ein funktionierendes Datenverarbeitungssystem, zum Herunterladen und Verarbeiten von Zeitungsartikeln, entwickelt, um Clustering Algorithmen eine Grundlage zu geben. Die präsentierten Selektionsstrategien und Clustering Algorithmen haben ähnliche Effekte auf die Resultate.de
dc.description.abstractInterpreting and summarizing textual content without the supervision of human experts is an exploratory process involving NP-hard algorithms. Using techniques of text mining and document clustering as an approach of unsupervised machine learning, grouping textual content of online newspaper articles into coherent categories and real world events is subject of this thesis. Additionally, building a functioning data pipeline for scraping and preprocessing newspaper articles, feeding clustering algorithms, shows promising results. In short, the presented feature selection and clustering strategies yield similar effects.en
dc.language.isoenen
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004 Informatik
dc.titleContinuous Clustering for a Daily News Summarization Systemen
dc.typeThesis
openaire.rightsinfo:eu-repo/semantics/openAccess
thesis.grantor.departmentDepartment Informatik
thesis.grantor.placeHamburg
thesis.grantor.universityOrInstitutionHochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.refereeZukunft, Olaf-
tuhh.gvk.ppn862154642
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-74156-
tuhh.note.externpubl-mit-pod
tuhh.note.intern1
tuhh.oai.showtrueen_US
tuhh.opus.id3395
tuhh.publication.instituteDepartment Informatik
tuhh.type.opusBachelor Thesis-
dc.subject.gndSoftware
dc.subject.gndZusammenfassung
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersion
dc.type.thesisbachelorThesis
dcterms.DCMITypeText-
tuhh.dnb.statusdomain-
item.advisorGNDNeitzke, Michael-
item.languageiso639-1en-
item.fulltextWith Fulltext-
item.creatorGNDNitsche, Matthias-
item.openairetypeThesis-
item.grantfulltextopen-
item.creatorOrcidNitsche, Matthias-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Nitsche.pdf1.82 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

272
checked on 14.01.2025

Download(s)

267
checked on 14.01.2025

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.