Final Thesis: Automatisierte Generierung von Datenpipelines

Abstract: Die Notwendigkeit, wiederholt Code zu schreiben, der wenig kreatives Denken erfordert, kann als eintönig empfunden werden und Zeit in Anspruch nehmen, die Kunden für wichtigere Aufgaben nutzen könnten. Dieser Prozess lässt sich durch die Automatisierung mittels eines Codegenerators, der Startercode erzeugt, optimieren. In dieser Arbeit werden die Methoden Scaolding, Reinforcement Learning und benutzerdeniertes ChatGPT zur Codegenerierung analysiert. Der Fokus liegt auf einem Vergleich der Geschwindigkeit der Codegenerierung und der Erweiterbarkeit. Hierfür werden die Systemarchitekturen der Lösungen nach umfassender Literaturrecherche implementiert, und die vom Evaluator gesammelten Ergebnisse werden anschlieÿend bewertet. Die Bewertungskriterien umfassen die Anzahl korrekt erzeugter Java-Modelle, die Anzahl erfolgreich generierter SQLiteund PostgreSQL-Datenbanken sowie die Geschwindigkeit der Codegenerierung. Die Ergebnisse zeigen, dass der Einsatz der neuesten Technologien nicht immer von Vorteil ist. Scaolding erweist sich als einfacher in der Implementierung und Wartung und generiert Code schneller. Insgesamt bietet diese Arbeit einen umfassenden Überblick über die Möglichkeiten der Codegenerierung.

Keywords: JValue, Engineering Thesis

PDF: Master Thesis

Reference: Choro Ulan Uulu. Automatisierte Generierung von Datenpipelines. Master Thesis. Friedrich-Alexander-Universität Erlangen-Nürnberg: 2024.