Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorWilke, Robin-
dc.contributor.authorBuscaglia Uchaneishvili, Jordi-
dc.date.accessioned2025-12-03T10:13:33Z-
dc.date.available2025-12-03T10:13:33Z-
dc.date.created2025-04-04-
dc.date.issued2025-12-03-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/18438-
dc.description.abstractDie Fähigkeit von großen Sprachmodellen natürliche Sprache in Code umzuwandeln, hat sich in den letzten Iterationen erheblich verbessert. Bestehende Methoden wie GitHub Copilot zeigen, dass ihre Benutzung äußerst hilfreich sein kann, jedoch ihre Funktionalität nur über externe Anbieter zugänglich ist. Dies kann ein Problem für Unternehmen mit strengen Datenschutz- oder Compliance-Anforderungen sein. Eine Alternative dazu könnten lokale Sprachmodelle sein. Lokale Sprachmodelle, die Code unter Verwendung von unternehmensinternen Code-Repositories generieren können, können insbesondere für Unternehmen mit strengen Datenschutzanforderungen von Vorteil sein. Das Ziel dieser Bachelorarbeit ist es, die Machbarkeit von lokalen Sprachmodellen zur Code- Generierung zu untersuchen. Diese Arbeit untersucht, inwieweit Retrieval-Augmented Generation genutzt werden kann, um den notwendigen Code aus dem unternehmens-internen Repository als Kontext zu holen. Mit dem Kontext soll das Sprachmodell anschließend Code generieren. Zusätzlich wird in dieser Arbeit untersucht, inwieweit Sprachmodelle mithilfe von Filament- Code und der Filament-Dokumentation durch Fine-Tuning trainiert werden können. Abschließend wird diese Arbeit untersuchen, wie die Kombination von RAG und Fine-Tuning genutzt werden kann, um die Leistung in der Codegenerierung zu steigern.de
dc.description.abstractThe ability of Large Language Models (LLMs) to transform natural language into code has significantly improved over the last iterations. Existing methods, such as GitHub Copilot, demonstrate that their usability is highly robust, but their functionality can only be accessed through external providers. This can pose a problem for companies with strict data protection or compliance requirements. An alternative to this could be local LLMs. Local code generation LLMs that can generate code using company internal code repository can be particularly beneficial for companies with stringent data protection requirements. The motivation of this bachelor thesis is therefore to investigate the feasibility of using local LLMs for code generation. This thesis investigates the extent to which Retrieval-Augmented Generation (RAG) can be used, to retrieve the necessary code from the companies internal repository to generate code. It will also explore how RAG can enhance the usability and relevance of LLM-generated outputs. Additionally, this thesis will investigate the extent to which LLMs can be fine-tuned using examples from private code repositories, such as Philips’ internal repository for User Interface (UI) components, known as Filament. Finally, this thesis will examine how the combination of both RAG and fine-tuning on a companies private repository can be leveraged to maximize performance for code generation tasks.en
dc.language.isoenen_US
dc.subjectRetrieval-Augmented Generationen_US
dc.subjectLarge Language Modelen_US
dc.subjectUser Interfaceen_US
dc.subjectContinuous Bag of Wordsen_US
dc.subjectContinuous Skip-gram Modelen_US
dc.subject.ddc600: Techniken_US
dc.titleLarge Language Models for Software Development: Evaluating the Feasibility of Local Large Language Models for Code Generationen
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Fahrzeugtechnik und Flugzeugbau (ehemalig, aufgelöst 10.2025)en_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeIslam, Sami-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-223306-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Fahrzeugtechnik und Flugzeugbau (ehemalig, aufgelöst 10.2025)en_US
tuhh.publication.instituteFakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.openairetypeThesis-
item.languageiso639-1en-
item.creatorGNDBuscaglia Uchaneishvili, Jordi-
item.creatorOrcidBuscaglia Uchaneishvili, Jordi-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.advisorGNDWilke, Robin-
item.grantfulltextopen-
item.fulltextWith Fulltext-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Zur Kurzanzeige

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.