Weiter zum Ihnhalt

Machine Learning: Der einfache Weg zu exakten Mietpreis­schät­zungen

Letzte Aktualisierung: 12. Mai 2025

Eine Bache­lor­arbeit, in Koope­ration mit Wüest Partner, über die Heraus­for­de­rungen und Chancen der Verwendung von „Blackbox“-Modellen in der Mietpreis­schätzung.

Das Ziel der hedoni­schen Mietpreis­schätzung ist an sich sehr simpel: Gesucht wird eine Funktion, die als Einga­be­werte verschiedene Objek­tei­gen­schaften erhält und einen Preis ausspuckt, der möglichst gut die Wirklichkeit wieder­spiegelt. Die klassi­schen Verfahren zur  Mietpreis­schätzung haben jedoch eine Schwach­stelle. Bei ihnen werden eine Vielzahl von Annahmen getroffen und dass, obwohl zunächst einmal vollkommen unbekannt ist, wie die Schätz­funktion überhaupt aussieht. Das Problem ist schnell ersichtlich: Die Annahmen können falsch sein und es macht viel Arbeit sie alle zu überprüfen. Es wäre also erstre­benswert, für eine Schätzung möglichst wenige Annahmen treffen zu müssen. 

artifialIntelligence

Beispiel eines Partial Depen­dence Plots (PDP). Der PDP zeigt den mittleren margi­nalen Effekt einer Verän­derung von ein- oder zwei erklä­renden Variablen auf die Schät­zungen eines Machine-Learning-Modells. Ein PDP kann zeigen, ob die Beziehung zwischen der Zielgröße und einem Merkmal linear, monoton oder komplexer ist (Molnar, 2019). In dieser Grafik wird der mittlere Effekt einer Verän­derung des Baujahrs und der Wohnungs­größe auf den Mietpreis darge­stellt. Das Baujahr und der Mietpreis sind hier standar­di­siert.

An dieser Stelle kommt die Methode des Machine-Learnings ins Spiel. Machine Learning ist eine Sammel­be­zeichnung für verschiedene Algorithmen mit denen ein Computer, auf Basis von Daten, Vorher­sagen treffen kann. Die Algorithmen, die sich für eine Mietpreis­schätzung eigenen, können auch als nicht-lineare, nicht-parametrische Erwei­terung von klassi­schen Regres­si­ons­me­thoden verstanden werden. Ihr Vorteil gegenüber den klassi­schen Methoden, wie beispiels­weise einer linearen Regression mit einem OLS-Schätzer, bestehen darin, dass keine Annahmen über die funktionale Form oder die zugrun­de­lie­gende Daten­ver­teilung getroffen werden müssen. Mit Machine-Learning können nicht-lineare Bezie­hungen oder Wechsel­wir­kungen der erklä­renden Variablen, mehr oder weniger, automa­tisch erfasst werden. Daher können sie häufig exaktere Schät­zungen abgeben und das auch noch mit weniger Arbeits­aufwand für den Ersteller des Schätz­mo­dells.  

Grafik

ICE-Diagramme (Individual Condi­tional Expec­ta­tions) zeigen eine Linie pro Instanz, die anzeigt, wie sich die Vorhersage der Instanz ändert, wenn sich ein Merkmal ändert. In der Grafik sind ICE Plots von 60 zufällig gezogenen Wohnungs­in­se­raten zu sehen, bei denen die Wohnungs­größe variiert wurde. Ziel dieser Darstellung ist es heterogene Effekte in den Schät­zungen erkennen zu können und ggf. den Ursachen dafür auf den Grund zu gehen.

Doch einen Nachteil gibt es: Die Inter­pre­tier­barkeit. Die Schät­zungen, die mithilfe von Machine-Learning-Modellen erstellt werden, lassen sich nur schwer nachvoll­ziehen. Gerade das ist aber eine notwendige Voraus­setzung, um der Methode trauen zu können. In der Bache­lor­arbeit wurde daher ein beson­derer Fokus auf das sogenannte Inter­pr­e­table Machine Learning gelegt; eine noch recht junge Forschungs­dis­ziplin, die es sich zum Ziel gesetzt hat, die Schät­zungen trans­parent zu machen. Exempla­risch wurde ein künst­liches neuro­nales Netz, ein Parade­bei­spiel für ein Blackbox-Modell aus dem Bereich des Machine-Learnings, zuerst trainiert und anschließend mit Hilfe von Individual Condi­tional Expeca­ta­tions (zu sehen in Abbildung 2), Partial Depen­dence Plots (zu sehen in Abbildung 1) und vielen weiteren Methoden und Darstel­lungs­formen analy­siert. Dadurch  ist es möglich geworden, die gewohnte Inter­pre­tier­barkeit, à la „Wenn x sich um … verändert, dann verändert sich y um …“ , auch bei einem Machine-Learning Modellen sicher­zu­stellen. Inter­pr­e­table Machine-Learning ermög­licht so eine Verbindung und eine Ergänzung des bisher bestehenden Exper­ten­wissens mit den Möglich­keiten von Machine-Learning.