| DC Element | Wert | Sprache |
|---|---|---|
| dc.contributor.advisor | Wilke, Robin | - |
| dc.contributor.author | Buscaglia Uchaneishvili, Jordi | - |
| dc.date.accessioned | 2025-12-03T10:13:33Z | - |
| dc.date.available | 2025-12-03T10:13:33Z | - |
| dc.date.created | 2025-04-04 | - |
| dc.date.issued | 2025-12-03 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.12738/18438 | - |
| dc.description.abstract | Die Fähigkeit von großen Sprachmodellen natürliche Sprache in Code umzuwandeln, hat sich in den letzten Iterationen erheblich verbessert. Bestehende Methoden wie GitHub Copilot zeigen, dass ihre Benutzung äußerst hilfreich sein kann, jedoch ihre Funktionalität nur über externe Anbieter zugänglich ist. Dies kann ein Problem für Unternehmen mit strengen Datenschutz- oder Compliance-Anforderungen sein. Eine Alternative dazu könnten lokale Sprachmodelle sein. Lokale Sprachmodelle, die Code unter Verwendung von unternehmensinternen Code-Repositories generieren können, können insbesondere für Unternehmen mit strengen Datenschutzanforderungen von Vorteil sein. Das Ziel dieser Bachelorarbeit ist es, die Machbarkeit von lokalen Sprachmodellen zur Code- Generierung zu untersuchen. Diese Arbeit untersucht, inwieweit Retrieval-Augmented Generation genutzt werden kann, um den notwendigen Code aus dem unternehmens-internen Repository als Kontext zu holen. Mit dem Kontext soll das Sprachmodell anschließend Code generieren. Zusätzlich wird in dieser Arbeit untersucht, inwieweit Sprachmodelle mithilfe von Filament- Code und der Filament-Dokumentation durch Fine-Tuning trainiert werden können. Abschließend wird diese Arbeit untersuchen, wie die Kombination von RAG und Fine-Tuning genutzt werden kann, um die Leistung in der Codegenerierung zu steigern. | de |
| dc.description.abstract | The ability of Large Language Models (LLMs) to transform natural language into code has significantly improved over the last iterations. Existing methods, such as GitHub Copilot, demonstrate that their usability is highly robust, but their functionality can only be accessed through external providers. This can pose a problem for companies with strict data protection or compliance requirements. An alternative to this could be local LLMs. Local code generation LLMs that can generate code using company internal code repository can be particularly beneficial for companies with stringent data protection requirements. The motivation of this bachelor thesis is therefore to investigate the feasibility of using local LLMs for code generation. This thesis investigates the extent to which Retrieval-Augmented Generation (RAG) can be used, to retrieve the necessary code from the companies internal repository to generate code. It will also explore how RAG can enhance the usability and relevance of LLM-generated outputs. Additionally, this thesis will investigate the extent to which LLMs can be fine-tuned using examples from private code repositories, such as Philips’ internal repository for User Interface (UI) components, known as Filament. Finally, this thesis will examine how the combination of both RAG and fine-tuning on a companies private repository can be leveraged to maximize performance for code generation tasks. | en |
| dc.language.iso | en | en_US |
| dc.subject | Retrieval-Augmented Generation | en_US |
| dc.subject | Large Language Model | en_US |
| dc.subject | User Interface | en_US |
| dc.subject | Continuous Bag of Words | en_US |
| dc.subject | Continuous Skip-gram Model | en_US |
| dc.subject.ddc | 600: Technik | en_US |
| dc.title | Large Language Models for Software Development: Evaluating the Feasibility of Local Large Language Models for Code Generation | en |
| dc.type | Thesis | en_US |
| openaire.rights | info:eu-repo/semantics/openAccess | en_US |
| thesis.grantor.department | Department Fahrzeugtechnik und Flugzeugbau (ehemalig, aufgelöst 10.2025) | en_US |
| thesis.grantor.universityOrInstitution | Hochschule für Angewandte Wissenschaften Hamburg | en_US |
| tuhh.contributor.referee | Islam, Sami | - |
| tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-223306 | - |
| tuhh.oai.show | true | en_US |
| tuhh.publication.institute | Department Fahrzeugtechnik und Flugzeugbau (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.publication.institute | Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.type.opus | Bachelor Thesis | - |
| dc.type.casrai | Supervised Student Publication | - |
| dc.type.dini | bachelorThesis | - |
| dc.type.driver | bachelorThesis | - |
| dc.type.status | info:eu-repo/semantics/publishedVersion | en_US |
| dc.type.thesis | bachelorThesis | en_US |
| dcterms.DCMIType | Text | - |
| tuhh.dnb.status | domain | en_US |
| item.openairetype | Thesis | - |
| item.languageiso639-1 | en | - |
| item.creatorGND | Buscaglia Uchaneishvili, Jordi | - |
| item.creatorOrcid | Buscaglia Uchaneishvili, Jordi | - |
| item.cerifentitytype | Publications | - |
| item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
| item.advisorGND | Wilke, Robin | - |
| item.grantfulltext | open | - |
| item.fulltext | With Fulltext | - |
| Enthalten in den Sammlungen: | Theses | |
Dateien zu dieser Ressource:
| Datei | Beschreibung | Größe | Format | |
|---|---|---|---|---|
| BA_Large Language Models for Software Development Evaluating the Feasibility_geschwärzt.pdf | 2.48 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.