Wie bist du an die Aufgabe herangegangen?
Gleich zu Beginn stellte ich fest, dass die uns zur Verfügung gestellte Datenmenge gering war. Generell gilt für das Machine Learning: „Data is key“. Daher versuchte ich, den Datensatz heterogener zu gestalten und suchte nach zusätzlichen Datenquellen, wie beispielsweise zur Luftqualität, zum Verkehr und zu Gebäudeemissionen.
Inwiefern hat dir deine Arbeit in der Assurance bei EY geholfen?
Ich habe allein an der Challenge teilgenommen. Der direkte fachliche Bezug zur Assurance war zwar begrenzt, aber ich bin überzeugt, dass er im Team noch stärker ausgeprägt gewesen wäre. Dennoch wird KI auch bei uns immer relevanter. Obwohl Regulatorik und Compliance im Finanzumfeld oft den schnellen Einsatz von KI bremsen, arbeiten wir zunehmend an Projekten, bei denen wir automatisieren und programmieren. Die strukturierte, strategische Herangehensweise aus meinem Job hat mir jedoch sehr geholfen.
Was waren die größten Herausforderungen bei der Entwicklung deines Modells?
Die größte Herausforderung war die begrenzte Datenmenge, die uns zur Verfügung stand. Für das Training des Modells benötigt man viele Daten, um Overfitting zu vermeiden. Ein Modell, das zu gut auf die Trainingsdaten passt, funktioniert oft nicht gut mit Testdaten und generalisiert daher nicht ausreichend.
Neben der Modellleistung war auch die Interpretierbarkeit der Ergebnisse ein Ziel der Challenge. Daher bestand die Herausforderung darin, den Spagat zwischen Leistung und Komplexität des Modells zu schaffen. Einfachere Modelle ermöglichen leichtere und umsetzbare Erkenntnisse.
Welche Rolle spielen KI und Daten für die Stadtplanung der Zukunft?
Ich sehe hier enormes Potenzial. Durch KI können sämtliche Aspekte einer Stadt – wie Verkehrsfluss, Energiebeschaffung und Gebäudelogistik optimiert werden. Leider scheitert es oft an der Implementierung. Ich denke, dass wir in Deutschland und Europa mutiger in Bezug auf Investitionen und die Umsetzung solcher Innovationen sein könnten.
Gab es einen besonderen Aha- Moment während der Challenge?
Ich habe gelernt, dass weniger oft mehr ist. Anfangs hatte ich tausende Spalten an potenziellen Daten zur Vorhersage im Modell, was die Trainingszeit verlängerte und die Interpretierbarkeit erschwerte. Am Ende reduzierte ich die Faktoren auf 58, und das Modell wurde besser. Mein Learning: Machine Learning ist experimentell. Ein Teil ist Wissenschaft und Forschung, der andere besteht aus Trial-and-Error.
Was würdest du anderen mitgeben, die überlegen, bei so einer Challenge mitzumachen?
Einfach ausprobieren! Man lernt immer dazu – sei es durch neue Tools, Datenarten oder Perspektiven. Im Rahmen der Challenge knüpfte ich viele neue Kontakte, auch über meine eigene Service Line hinaus. Die Teilnahme hat mir verdeutlicht, dass man den Mut aufbringen sollte, neue Dinge auszuprobieren und einfach mal ins kalte Wasser zu springen. Man wächst an solchen Herausforderungen.
Johns Platzierung zeigt, wie viel Potenzial in der Kombination von KI, Daten und Eigeninitiative steckt – und dass innovative Ansätze oft genau dort entstehen, wo man den Mut hat, Neues auszuprobieren.