Vers le contenu

La puissance de l’algorithme pour estimer un bien immobilier

20.09.2022

La puissance de l’algorithme pour estimer un bien immobilier

En cinq ans, grâce à l’intelligence artificielle et au Machine Learning embarqués dans des algorithmes d’estimation, des progrès spectaculaires ont été accomplis pour évaluer avec une plus grande rapidité et précision les biens immobiliers à l’achat et à la vente sur le territoire français.

La plupart des modèles algorithmiques d’estimation dans l’immobilier reposent sur la méthode hédoniste. Celle-ci part du principe que la valeur d’un bien sur le marché immobilier est constituée par la somme des prix implicites donnés à chacune de ses caractéristiques (emplacement, état du bâtiment, standard, année de construction, nombre de pièces, tranquillité, proximité du lieu de travail, nature, etc.). Le prix implicite mesure l’utilité positive ou négative de chaque attribut. La méthode hédoniste consiste ensuite à comparer ce bien immobilier avec une base de données.

Base de données

En l’occurrence, l’algorithme d’estimation de Wüest Partner exploite une base de données de 250 000 appartements et maisons vendus et en vente au cours des 12 derniers mois. Cette base de données est alimentée, en partie, par les « Demandes de valeurs foncières (DVF) » de la direction générale des finances publiques. Très complet, le jeu de données des DVF présente néanmoins deux défauts majeurs : une mise à jour semestrielle et un descriptif des biens peu détaillé.  

La base de données est donc enrichie par les annonces du marché, actualisées quotidiennement, provenant des nombreux portails et passerelles de diffusion en ligne, ainsi que de partenariats. Ces annonces contiennent davantage de caractéristiques. Elles reflètent l’offre courante du marché, mais affichent un prix public de commercialisation et non un prix final. Wüest Partner a pour y remédier développé un modèle permettant l’imputation et l’estimation des possibles négociations ainsi que des frais d’agence.

Modèle d’estimation, basé sur le Machine Learning

Le modèle d’estimation, basé sur le Machine Learning, permet in fine de calculer un prix net vendeur. Dans le détail, pour construire un tel modèle prédictif de prix de transaction, une grande quantité de données est extraite, nettoyée, triée, agrégée. Des échantillons sont sélectionnés pour tester et apprendre. On introduit de l’élasticité sur les dimensions quantitatives connues, comme les prix et les surfaces, permettant de stabiliser l’équation. L’analyse en composantes principales permet ensuite de mesurer l’importance et le poids de chacun des facteurs tout en identifiant les corrélations. Il s’agit ensuite de sélectionner les variables significatives, qui rendent compte de l’unité immobilière (macro-situation), d’informations quantitatives (surface habitable nette, superficie du terrain, année de construction), d’informations qualitatives (GES, DPE) et d’autres renseignant sur les commodités (place de stationnement, balcon, ascenseur, etc.).

A partir de ces variables, une équation de régression linéaire est construite. Le modèle est ensuite calibré. Le tout sous la supervision d’une équipe d’ingénieurs et de data scientists.

Ce modèle n’est pas figé, il évolue constamment en fonction des événements exceptionnels, ou structurels qui orientent le marché. On sait, par exemple, qu’à l’approche de la rentrée scolaire, de nombreuses familles emménagent, ce qui provoque un rebond d’activité sur le marché. Il y a beaucoup plus d’acheteurs. C’est une périodicité qui sera lissée car ce rebond ne fait pas réellement état de la conjoncture. En revanche, un événement de plus long terme, comme le Covid, peut faire évoluer les prix de l’immobilier et l’impact de certains critères, comme d’avoir un jardin, un balcon ou une pièce supplémentaire.

Prix virtuels

Ce modèle d’estimation doit donc être rafraîchi régulièrement pour prendre en considération les nouvelles offres, les nouvelles transactions, les modifications structurelles. A noter qu’un autre algorithme se superpose à ce modèle pour intégrer l’évolution mensuelle des prix à la commune et des quartiers, et définir des prix virtuels (prix au m2 à l’échelle de la commune). Cette modélisation, selon une méthodologie statistique développée par Wüest Partner, intègre des facteurs socio-démographiques et économiques (comme la population, le revenu moyen, la fiscalité), des facteurs immobiliers (comme le nombre de résidences secondaires, le taux de maisons) spécifiques à la commune et l’état de l’offre et la demande du marché. Ces prix virtuels, qui font état des tendances de marché, sont utilisés pour calibrer et contrôler l’estimation.

Les principaux indicateurs pour valider le modèle

En bout de course, on attend de ce modèle algorithmique qu’il soit réaliste et fiable. Pour le vérifier, trois indicateurs seront analysés : la précision (les erreurs doivent être inférieures à 20%), le biais et la médiane des estimations divisée par le prix (savoir si l’on surestime ou sous-estime un portefeuille).

Les résultats obtenus par cette modélisation sont très satisfaisants et permettent d’estimer un prix de vente dans six configurations avec un niveau de précision de plus de 85% pour les appartements situés dans des zones à densité forte et modérée, et un niveau de précision compris entre 81 et 86% pour les maisons selon ces mêmes densités. Le degré de précision est légèrement plus bas, comme attendu, dans les zones à faible densité.

Cet outil d’estimation est disponible pour les professionnels de l’immobilier, en France, sous deux déclinaisons différentes, API et widget.