StackOne - Effiziente CI/CD Pipelines für Web APIs: Maximierung der Testabdeckung und Performance-Optimierungen

Bachelorarbeit

Abstract

Die vorliegende Arbeit verfolgt das Ziel, einen umfassenden und optimierten CI/CDWorkflow für Laravel-basierte APIs zu entwickeln und zu evaluieren. Im Rahmen dessen erfolgt eine Identifikation und Implementierung von Methoden zur Maximierung der Testabdeckung und Performance. Um das definierte Ziel zu erreichen, werden im Rahmen dieser Arbeit verschiedene Teilaspekte einer eingehenden Untersuchung und Bearbeitung unterzogen.

Im Rahmen der vorliegenden Untersuchung ist zu ermitteln, welche Teststrategien sich am besten eignen, um eine umfassende Testabdeckung zu gewährleisten. Zudem ist zu klären, welche Best-Practices bei der Implementierung von Unit- und Integrationstests existieren.

Ein weiterer Fokus liegt auf der Optimierung der Testdurchführung sowie der CI/CDPipeline. Im Rahmen dessen erfolgt eine Untersuchung von Techniken und Tools zur Reduzierung der Testausführungszeit, wobei ein Schwerpunkt auf der parallelisierten Ausführung liegt. Des Weiteren werden Caching-Strategien für Dependencies und Build-Artefakte evaluiert und implementiert. Im Anschluss erfolgt eine Evaluierung der Auswirkungen der optimierten CI/CD-Prozesse.

Ausgangslage und Forschungsfrage

Continuous Integration und Continuous Deployment (CI/CD) verschieben Qualitätssicherung nach vorn: Statt Fehler erst kurz vor dem Release zu finden, entsteht nach jedem Commit eine schnelle Rückmeldung aus Build, Tests und Deployment.[1] In Web-API-Projekten sind diese Feedback-Schleifen besonders wichtig, weil Änderungen oft viele Clients betreffen und Fehler in Schnittstellen schnell produktiv werden.

Die Arbeit adressiert eine typische Ausgangslage: Eine bestehende Web-API ohne automatisierte Tests und ohne Pipeline. Daraus ergeben sich zwei zentrale Forschungsfragen: Welche Teststrategien liefern schnell eine hohe und verlässliche Abdeckung, und welche Maßnahmen verkürzen (oder stabilisieren) die Laufzeit einer CI/CD-Pipeline in der Praxis?

Nicht behandelt werden vollständige organisatorische DevOps-Transformationen oder herstellerspezifische Plattformvergleiche. Im Mittelpunkt stehen konkrete, übertragbare Bausteine: Testdesign, Testarten für Web-APIs und messbare Pipeline-Optimierungen im Kontext kontinuierlicher Auslieferung.[2]

Methodisches Vorgehen

Für die Testsuite wird ein mehrstufiger Ansatz gewählt: Unit-Tests decken reine Logik ohne Seiteneffekte ab, während Integrationstests das Verhalten der API inklusive Datenbankzustand prüfen. Bei der Testfallentwicklung dominieren Black-Box-Verfahren (z.B. Äquivalenzklassen, Grenzwertanalyse, bewusst gewählte Fehlerfälle), ergänzt durch ausgewählte White-Box-Aspekte dort, wo Datenflüsse oder Strukturmerkmale zentral sind.[3]

Für API-Tests werden Endpunkte entlang ihrer fachlichen Gruppierung strukturiert. Die Testumgebung nutzt eine separate Testdatenbank, generiert Mock-Daten über Factory-Mechanismen und kapselt Tests in Transaktionen, um reproduzierbare Zustände zu garantieren. Abhängigkeiten zu externen Services werden in Tests durch Stubs ersetzt, um Kosten, Latenz und Flakiness zu reduzieren.[4]

Zur Bewertung nicht-funktionaler Anforderungen wird ein Werkzeug für Last- und Performance-Tests eingesetzt. In der Umsetzung zeigt sich jedoch eine praxisrelevante Einschränkung: Rate-Limiting-Mechanismen, die an IP-Adressen gebunden sind, können lokale Lastgeneratoren ausbremsen und die Aussagekraft einzelner Lasttests begrenzen.

Die CI/CD-Pipeline wird in mehreren Konfigurationen verglichen: eine Baseline mit typischen Schritten (Checkout, Setup, Dependency-Installation, Datenbank-Migration, Tests, Cleanup), eine Variante mit Dependency-Caching sowie eine Variante mit zusätzlicher Parallelisierung der Testausführung (u.a. mit ParaTest).[5] Gemessen werden Durchlaufzeiten und Schwankungen über verschiedene Runner-Umgebungen (direkt auf Host-Hardware vs. Container-Runner vs. Cloud-Runner).

Die gewonnenen Erkenntnisse

Die Testsuite erreicht eine hohe Abdeckung und verbessert gleichzeitig die Robustheit der API gegenüber fehlerhaften Requests. Im Kern zeigen sich drei Ergebnisblöcke: Testabdeckung, Beschleunigung einzelner Pipeline-Schritte und die (nicht immer intuitive) Wirkung auf die Gesamtdurchlaufzeit.

Konkrete Befunde:

Die Code-Coverage liegt bei 93,94% (Lines), 80,28% (Functions & Methods) und 52,38% (Classes & Traits). Die Testsuite umfasst 33 Testdateien mit insgesamt 135 Tests.
Dependency-Caching verkürzt die Installationszeit von Abhängigkeiten deutlich (z.B. im besten Fall um 35,7%), erhöht aber gleichzeitig den Aufwand in der Cleanup-Phase, weil Cache-Artefakte erneut geschrieben/aktualisiert werden.
Parallelisierung reduziert die reine Testdauer signifikant (typisch um 35-42%; bei größerer Testsuite sogar über 50%), der Effekt auf die Gesamtdauer kann jedoch durch Overheads anderer Pipeline-Schritte überkompensiert werden.
Über mehrere Runner-Umgebungen hinweg zeigt sich: Die schnellste Gesamtausführung entsteht in der direkten Host-Ausführung, Container- und Cloud-Runner bringen zusätzliche Laufzeitkosten.
Auch wenn die optimierten Konfigurationen nicht durchgängig schneller sind, sinkt die Varianz der Laufzeiten in mehreren Szenarien; die Pipeline wird damit planbarer.

Was die Ergebnisse bedeuten

Die Ergebnisse verdeutlichen, dass lokale Optimierungen (Caching, Parallelisierung) nicht automatisch die Gesamtdauer verbessern. CI/CD-Pipelines bestehen aus vielen Schritten mit sehr unterschiedlichem Kostenprofil: Wenn die Testphase nur einen kleinen Anteil der Gesamtlaufzeit ausmacht, kann selbst eine starke Beschleunigung der Tests den Gesamtwert kaum bewegen.

Caching zeigt einen klaren Trade-off: Es spart Zeit beim Herunterladen und Installieren von Abhängigkeiten, kann aber durch Cache-Packaging und -Writeback in Cleanup oder Post-Steps wieder Zeit verlieren. Zusätzlich entstehen sicherheitsrelevante Risiken, wenn Cache-Inhalte oder Tokens falsch konfiguriert sind.[6] Der Nutzen hängt damit stark von Projektgröße, Netzwerkbedingungen, Cache-Strategie und Runner-Implementierung ab.

Parallelisierung wirkt besonders dann, wenn die Testsuite wächst und Tests weitgehend unabhängig laufen.[7] Gleichzeitig steigen Anforderungen an Isolation (z.B. Datenbankzustände, Nebenwirkungen) und an die Beobachtbarkeit (z.B. konsolidierte Testreports). Die Arbeit zeigt außerdem, dass nicht-funktionale Tests in realen Umgebungen an Infrastrukturgrenzen stoßen können, etwa durch IP-basiertes Rate Limiting, das lokale Lasttests verfälscht.

Kernaussagen und Ausblick

Eine nachträglich aufgebaute Testsuite kann in kurzer Zeit hohe Code-Abdeckung erreichen und die API-Qualität messbar verbessern. Parallelisierung reduziert die Testdauer deutlich und skaliert mit wachsender Testsuite, während Caching kontextabhängig ist und als Gesamtlaufzeit-Optimierung nicht garantiert funktioniert.

Für die Praxis ergibt sich ein klarer Takeaway: Pipeline-Optimierung braucht Messungen pro Schritt, nicht nur „Best Practices“. Wer die Pipeline planbarer machen will, sollte neben der mittleren Laufzeit auch die Varianz beobachten und Optimierungen dort ansetzen, wo sie den größten Anteil der Gesamtdauer beeinflussen.

Wissenschaftliche Grundlagen

[1] Fowler, M.Continuous Integration. URL: https://martinfowler.com/articles/continuousIntegration.html

[2] Leppänen, M.; Mäkinen, S.; Pagels, M.; Eloranta, V.-P.; Itkonen, J.; Mäntylä, M.; Munch, J. (2015). The highways and country roads to continuous deployment. IEEE Software 32.2. DOI: 10.1109/MS.2015.50

[3] Myers, G. J.; Sandler, C.; Badgett, T. (2011). The Art of Software Testing. John Wiley & Sons

[4] mockery/mockery. URL: https://github.com/mockery/mockery

[5] paratestphp/paratest. URL: https://github.com/paratestphp/paratest

[6] Gu, Y.; Bian, J.; Feng, C.; Yang, Y.; Wang, G.; Jia, X. (2024). More Haste, Less Speed: Cache Related Security Threats in Continuous Integration Services. 2024 IEEE Symposium on Security and Privacy (SP). DOI: 10.1109/SP54263.2024.00138

[7] Candido, J.; Melo, L.; d’Amorim, M. (2017). Test suite parallelization in open-source projects: A study on its usage and impact. 2017 32nd IEEE/ACM International Conference on Automated Software Engineering (ASE). DOI: 10.1109/ASE.2017.8115695

Vorherige Forschung Nächste Forschung

Zurück zur ÜbersichtEffiziente CI/CD Pipelines für Web APIs: Maximierung der Testabdeckung und Performance-Optimierungen