DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | von Luck, Kai | - |
dc.contributor.author | Lange, Timo | - |
dc.date.accessioned | 2024-12-11T07:58:56Z | - |
dc.date.available | 2024-12-11T07:58:56Z | - |
dc.date.created | 2022-07-12 | - |
dc.date.issued | 2024-12-11 | - |
dc.identifier.uri | https://hdl.handle.net/20.500.12738/16711 | - |
dc.description.abstract | Empfehlungssysteme (RS) sind weit verbreitet und werden in vielen Bereichen eingesetzt, z.B. bei der Empfehlung von Artikeln im elektronischen Handel, beim Musik und Videostreaming oder in Nachrichten-portalen. In dieser Arbeit wird ein proprietärer Datensatz für Nachrichtenempfehlungen vorgestellt, für den eine Basis an Messergebnissen erstellt und verschiedene Fragen behandelt werden, z.B. ob die Schlagzeile, der Teasertext oder der vollständige Artikeltext für Nachrichtenempfehlungen geeignet sind. Ein immer größerer Teil der RS-Forschung befasst sich mit Deep Learning (DL), daher wird sich diese Arbeit auf diesen Bereich von RS konzentrieren. Um ein geeignetes Empfehlungsmodell auszuwählen und festzustellen, welche Methoden zur Darstellung des Artikelinhalts verwendet werden können, wird eine breite Auswahl an aktuellen DL-basierten Sprachmodellen (LM) und RS betrachtet. Im Zuge der Implementierung des Modells und der Verarbeitungspipeline werden die Schwierigkeiten im Umgang mit einem großen realen Nachrichtendatensatz untersucht. Es stellte sich heraus, dass für das gewählte Modell der Teaser-Text am besten für Nachrichtenempfehlungen geeignet ist. Es hat sich ebenfalls gezeigt, dass bei der Verarbeitung eines realen Datensatzes die große Datenmenge und die hohe Dimensionalität der Daten die größte Herausforderung darstellten. Schlussendlich hat die Analyse der Daten das große Potenzial für personalisierte Nachrichtenempfehlungen aufgezeigt, da die meisten Artikel nur wenige Seitenaufrufe haben und viele Nutzer nur ein bis zwei Artikel ansehen. Daher könnten sehr gezielte Empfehlungen die Anzahl der Seitenaufrufe vieler Artikel, die eine sehr kleine Zielgruppe haben, erheblich steigern. | de |
dc.description.abstract | Recommendation systems (RS) are widely used and prevalent in many areas like recommending items in e-commerce, music and video streaming, as well as news portals. In this thesis, a proprietary news recommendation dataset is introduced for which a baseline will be established and several questions will be approached, like whether the headline, teaser text or full article text is suitable for news recommendation. An ever growing amount of RS research is going in the direction of deep learning (DL), so this work will focus on this domain of RS. To select an appropriate recommendation model and determine which methods can be used to represent the article content, a broad selection of current DL based language models (LM) and RS are reviewed. In the course of implementing the model and the processing pipeline, the difficulties in handling a large real world news dataset are examined. It turns out, that for the selected model, the teaser text worked best for news recommendation. Also it has shown, that in handling a real world dataset, the large amount of data and the high dimensionality of the data posed the biggest challenge. Lastly, the analysis of the data unveiled the great potential for personalized news recommendation, as most articles have just a few pageviews and many users just view one to two articles. So very targeted recommendations could significantly rise the pageview count of many articles, which have a very niche target audience. | en |
dc.language.iso | en | en_US |
dc.subject | Deep Learning | en_US |
dc.subject | Maschinelles Lernen | en_US |
dc.subject | Empfehlungen | en_US |
dc.subject | Nachrichten | en_US |
dc.subject | NLP | en_US |
dc.subject | Recommendation | en_US |
dc.subject | Machine Learning | en_US |
dc.subject.ddc | 004: Informatik | en_US |
dc.title | Deep Learning Based News Recommendation Using Text and Metadata | en |
dc.type | Thesis | en_US |
openaire.rights | info:eu-repo/semantics/openAccess | en_US |
thesis.grantor.department | Department Informatik | en_US |
thesis.grantor.universityOrInstitution | Hochschule für Angewandte Wissenschaften Hamburg | en_US |
tuhh.contributor.referee | Tiedemann, Tim | - |
tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-200373 | - |
tuhh.oai.show | true | en_US |
tuhh.publication.institute | Department Informatik | en_US |
tuhh.publication.institute | Fakultät Technik und Informatik | en_US |
tuhh.type.opus | Masterarbeit | - |
dc.type.casrai | Supervised Student Publication | - |
dc.type.dini | masterThesis | - |
dc.type.driver | masterThesis | - |
dc.type.status | info:eu-repo/semantics/publishedVersion | en_US |
dc.type.thesis | masterThesis | en_US |
dcterms.DCMIType | Text | - |
tuhh.dnb.status | domain | en_US |
item.creatorGND | Lange, Timo | - |
item.fulltext | With Fulltext | - |
item.creatorOrcid | Lange, Timo | - |
item.grantfulltext | open | - |
item.cerifentitytype | Publications | - |
item.advisorGND | von Luck, Kai | - |
item.languageiso639-1 | en | - |
item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
item.openairetype | Thesis | - |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
MA_Deep Learning Based News Recommendation Using Text and Metadata_geschwärzt.pdf | 2.37 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.