Automatisierte Codegenerierung und -tests mit Qwen 2.5 Max

Automatisierte Codegenerierung und -tests mit Qwen 2.5 Max – Ein Showcase

Die Welt der Künstlichen Intelligenz erlebt derzeit einen enormen Wandel. Mit der Veröffentlichung von leistungsfähigen Modellen wie Qwen 2.5 Max von Alibaba eröffnen sich neue Möglichkeiten in der Softwareentwicklung. Ein besonders spannendes Anwendungsgebiet ist die Kombination von automatisierter Codegenerierung und -prüfung. In diesem Artikel zeigen wir, wie mit Qwen 2.5 Max Code erstellt und gleichzeitig nach ISTQB-Kriterien getestet werden kann. Wir beleuchten zudem die Vor- und Nachteile dieses Ansatzes und diskutieren potenzielle Herausforderungen.

Qwen 2.5 Max – Ein Überblick

Qwen 2.5 Max ist ein leistungsfähiges KI-Modell von Alibaba, das in Benchmarks wie LiveCodeBench mit einer bemerkenswerten Leistung von 38,7 % überzeugt hat. Es wurde speziell für die Verarbeitung und Generierung von Code optimiert und bietet eine verbesserte Kontextverständnisfähigkeit. Damit eignet sich das Modell nicht nur zur Codegenerierung, sondern auch zur automatisierten Erstellung von Tests.

Was ist LiveCodeBench?

LiveCodeBench ist ein Benchmarking-Tool zur Evaluierung von KI-Modellen in Bezug auf ihre Fähigkeit, Code zu generieren und zu verstehen. Eine höhere Prozentzahl, wie die 38,7 % von Qwen 2.5 Max, bedeutet, dass das Modell in einer Reihe von standardisierten Testaufgaben überdurchschnittlich gut abschneidet und qualitativ hochwertigen Code produziert.

Mehr Informationen zu LiveCodeBench findet ihr hier: LiveCodeBench Website

Showcase: Code schreiben und testen mit Qwen 2.5 Max

Wir lassen uns von Qwen 2.5 Max eine einfache Funktion zur Primzahlenüberprüfung generieren und dazu noch die Unit-Tests, welche ISTQB Konform sein sollen.

Prompt: Wir möchten eine TypeScript-Funktion implementieren, die überprüft, ob eine gegebene Zahl eine Primzahl ist. Zusätzlich sollen wir Unit-Tests mit Jest schreiben, die den ISTQB-Kriterien entsprechen.

Von Qwen 2.5 Max generierte Funktion und dazugehörige ISTQB-konforme Unit-Tests mit Jest

Tests ausführen

Um die von Qwen 2.5 Max erstellte Funktion und Tests ausführen zu können, setzen wir ein Projekt im Microsoft Visual Studio Code auf und kopieren dort den Code für die Überprüfung der Primzahlen, so wie die generierten Unit-Tests hinein. Anschliessend installieren wir Jest und führen die Tests durch.

Testergebnis

Wie das unten aufgeführte Beispiel zeigt, konnten die von Qwen 2.5 Max generierten Unit-Tests, ohne Probleme erfolgreich in einer Entwicklungsumgebung wie Microsoft Visuel Studio Code, ausgeführt werden.

Analyse der Ergebnisse

Vorteile der KI-gestützten Codegenerierung und -prüfung

✅ Effizienz: Code und Tests können innerhalb von Sekunden generiert werden.
✅ Automatisierte Testfälle: Die KI stellt sicher, dass die Tests verschiedene Szenarien abdecken. In unserem Fall wurden Testfälle gemäss ISTQB Kriterien (Grenzwertanalysen, Good Case / Bad Case, Performancetests etc.) generiert.
✅ Reduzierung menschlicher Fehler: KI minimiert Tippfehler oder logische Fehler im Code.

Nachteile und Herausforderungen

⚠️ Qualitätssicherung: Der generierte Code muss manuell überprüft werden, um sicherzustellen, dass er korrekt und performant ist. Ohne eine genaue Analyse kann fehlerhafter oder ineffizienter Code entstehen.

⚠️ Komplexität: Die KI hat Schwierigkeiten bei komplexen Softwarestrukturen. Besonders End-to-End (E2E)-Tests, die eine vollständige Systemvalidierung erfordern, können nur bedingt automatisiert erstellt werden, da sie oft auf Integration und Nutzerinteraktion basieren.

⚠️ Abhängigkeit von Trainingsdaten: Das Modell basiert auf bestehenden Daten und generiert Code nach erlernten Mustern. Dies kann Innovation und massgeschneiderte Lösungen einschränken. Entwickler müssen den generierten Code oft nachträglich anpassen, um spezifische Anforderungen zu erfüllen.

Fazit

Qwen 2.5 Max zeigt beeindruckende Fähigkeiten in der automatisierten Codeerstellung und -prüfung. Besonders für Standardanwendungen und Unit-Tests kann die KI eine wertvolle Unterstützung bieten. Allerdings ist eine menschliche Überprüfung unerlässlich, um sicherzustellen, dass der Code qualitativ hochwertig ist und alle Anforderungen erfüllt. In Zukunft könnten solche Modelle jedoch eine noch grössere Rolle in der Softwareentwicklung spielen und den Entwicklungsprozess erheblich beschleunigen.

KI in der Softwareentwicklung gezielt einsetzen

Die Welt der Künstlichen Intelligenz entwickelt sich rasant weiter und eröffnet neue Möglichkeiten für die Codegenerierung und -prüfung. Doch welche KI-Tools sind für eure spezifischen Anforderungen am besten geeignet?

Bei Infometis sind wir spezialisiert auf verschiedene KI-gestützte Lösungen und beraten euch gerne individuell. Falls ihr mehr darüber erfahren möchtet, wie ihr KI gezielt in eure Entwicklungsprozesse integrieren könnt, vereinbart jederzeit unverbindlich einen Termin mit uns.

👉 Jetzt Kontakt aufnehmen!