Automatisierte Codegenerierung und -tests mit Qwen 2.5 Max – Ein Showcase

31.1.2025

Die Welt der Künstlichen Intelligenz erlebt derzeit einen enormen Wandel. Mit der Veröffentlichung von leistungsfähigen Modellen wie Qwen 2.5 Max von Alibaba eröffnen sich neue Möglichkeiten in der Softwareentwicklung. Ein besonders spannendes Anwendungsgebiet ist die Kombination von automatisierter Codegenerierung und -prüfung. In diesem Artikel zeigen wir, wie mit Qwen 2.5 Max Code erstellt und gleichzeitig nach ISTQB-Kriterien getestet werden kann. Wir beleuchten zudem die Vor- und Nachteile dieses Ansatzes und diskutieren potenzielle Herausforderungen.

Qwen 2.5 Max – Ein Überblick

Qwen 2.5 Max ist ein leistungsfähiges KI-Modell von Alibaba, das in Benchmarks wie LiveCodeBench mit einer bemerkenswerten Leistung von 38,7 % überzeugt hat. Es wurde speziell für die Verarbeitung und Generierung von Code optimiert und bietet eine verbesserte Kontextverständnisfähigkeit. Damit eignet sich das Modell nicht nur zur Codegenerierung, sondern auch zur automatisierten Erstellung von Tests.

Was ist LiveCodeBench?

LiveCodeBench ist ein Benchmarking-Tool zur Evaluierung von KI-Modellen in Bezug auf ihre Fähigkeit, Code zu generieren und zu verstehen. Eine höhere Prozentzahl, wie die 38,7 % von Qwen 2.5 Max, bedeutet, dass das Modell in einer Reihe von standardisierten Testaufgaben überdurchschnittlich gut abschneidet und qualitativ hochwertigen Code produziert.

Mehr Informationen zu LiveCodeBench findet ihr hier: LiveCodeBench Website

Showcase: Code schreiben und testen mit Qwen 2.5 Max

Wir lassen uns von Qwen 2.5 Max eine einfache Funktion zur Primzahlenüberprüfung generieren und dazu noch die Unit-Tests, welche ISTQB Konform sein sollen.

Prompt: Wir möchten eine TypeScript-Funktion implementieren, die überprüft, ob eine gegebene Zahl eine Primzahl ist. Zusätzlich sollen wir Unit-Tests mit Jest schreiben, die den ISTQB-Kriterien entsprechen.

Von Qwen 2.5 Max generierte Funktion und dazugehörige ISTQB-konforme Unit-Tests mit Jest

Von Qwen 2.5 Max generierte Funktion und dazugehörige ISTQB-Konforme Unit-Tests mit Jest

Tests ausführen

Um die von Qwen 2.5 Max erstellte Funktion und Tests ausführen zu können, setzen wir ein Projekt im Microsoft Visual Studio Code auf und kopieren dort den Code für die Überprüfung der Primzahlen, so wie die generierten Unit-Tests hinein. Anschliessend installieren wir Jest und führen die Tests durch.

Testergebnis

Wie das unten aufgeführte Beispiel zeigt, konnten die von Qwen 2.5 Max generierten Unit-Tests, ohne Probleme erfolgreich in einer Entwicklungsumgebung wie Microsoft Visuel Studio Code, ausgeführt werden.

Analyse der Ergebnisse

Vorteile der KI-gestützten Codegenerierung und -prüfung

Effizienz: Code und Tests können innerhalb von Sekunden generiert werden.
Automatisierte Testfälle: Die KI stellt sicher, dass die Tests verschiedene Szenarien abdecken. In unserem Fall wurden Testfälle gemäss ISTQB Kriterien (Grenzwertanalysen, Good Case / Bad Case, Performancetests etc.) generiert.
Reduzierung menschlicher Fehler: KI minimiert Tippfehler oder logische Fehler im Code.

Nachteile und Herausforderungen

⚠️ Qualitätssicherung: Der generierte Code muss manuell überprüft werden, um sicherzustellen, dass er korrekt und performant ist. Ohne eine genaue Analyse kann fehlerhafter oder ineffizienter Code entstehen.

⚠️ Komplexität: Die KI hat Schwierigkeiten bei komplexen Softwarestrukturen. Besonders End-to-End (E2E)-Tests, die eine vollständige Systemvalidierung erfordern, können nur bedingt automatisiert erstellt werden, da sie oft auf Integration und Nutzerinteraktion basieren.

⚠️ Abhängigkeit von Trainingsdaten: Das Modell basiert auf bestehenden Daten und generiert Code nach erlernten Mustern. Dies kann Innovation und massgeschneiderte Lösungen einschränken. Entwickler müssen den generierten Code oft nachträglich anpassen, um spezifische Anforderungen zu erfüllen.

Fazit

Qwen 2.5 Max zeigt beeindruckende Fähigkeiten in der automatisierten Codeerstellung und -prüfung. Besonders für Standardanwendungen und Unit-Tests kann die KI eine wertvolle Unterstützung bieten. Allerdings ist eine menschliche Überprüfung unerlässlich, um sicherzustellen, dass der Code qualitativ hochwertig ist und alle Anforderungen erfüllt. In Zukunft könnten solche Modelle jedoch eine noch grössere Rolle in der Softwareentwicklung spielen und den Entwicklungsprozess erheblich beschleunigen.

KI in der Softwareentwicklung gezielt einsetzen

Die Welt der Künstlichen Intelligenz entwickelt sich rasant weiter und eröffnet neue Möglichkeiten für die Codegenerierung und -prüfung. Doch welche KI-Tools sind für eure spezifischen Anforderungen am besten geeignet?

Bei Infometis sind wir spezialisiert auf verschiedene KI-gestützte Lösungen und beraten euch gerne individuell. Falls ihr mehr darüber erfahren möchtet, wie ihr KI gezielt in eure Entwicklungsprozesse integrieren könnt, vereinbart jederzeit unverbindlich einen Termin mit uns.

👉 Jetzt Kontakt aufnehmen!

Wir sind bereit für Ihren nächsten Schritt!

Sie möchten unsere Expertise nutzen und technologische Innovationen umsetzen?

Diese Webseite
verwendet Cookies

Cookies werden zur Benutzerführung und Webanalyse verwendet und helfen dabei, diese Webseite zu verbessern. Sie können hier unsere Cookie-Erklärung anzeigen oder hier Ihre Cookie-Einstellungen anpassen. Durch die weitere Nutzung dieser Webseite erklären Sie sich mit unserer Cookie-Richtlinie einverstanden.

Alle akzeptieren
Auswahl akzeptieren
Optimal. Funktionale Cookies zur Optimierung der Webseite, Social-Media-Cookies, Cookies für Werbezwecke und die Bereitstellung relevanter Angebote auf dieser Website und Websites Dritter sowie analytische Cookies zur Verfolgung von Website-Zugriffen.
Eingeschränkt. Mehrere funktionale Cookies für die ordnungsgemässe Anzeige der Website, z. B. um Ihre persönlichen Einstellungen zu speichern. Es werden keine personenbezogenen Daten gespeichert.
Zurück zur Übersicht

Sprechen Sie mit einem Experten

Haben Sie eine Frage oder suchen Sie weitere Informationen? Geben Sie Ihre Kontaktinformationen an und wir rufen Sie zurück.