Le Boncoin : base de données et web scraping
Dans un arrêt du 5 octobre 2022, la Cour de Cassation a été amenée à préciser les conditions d’application de la protection sui generis du producteur de base de données.
Dans cette affaire le site internet « entreparticuliers.com » met en ligne des annonces immobilières dont une partie reprend les annonces publiées sur le site internet « leboncoin.fr ».
La société exploitant « leboncoin.fr » (la « Société ») contestait la régularité d’une telle reprise au motif qu’elle constitue un système d’extraction de sa base de données immobilières.
Pour rappel, l’article L341-1 du Code de propriété intellectuelle définit le producteur de base de données comme « la personne qui prend l'initiative et le risque des investissements correspondants, bénéficie d'une protection du contenu de la base lorsque la constitution, la vérification ou la présentation de celui-ci atteste d'un investissement financier, matériel ou humain substantiel ».
En application des articles L342-1 et 2 du Code de la propriété intellectuelle, ce même producteur a la faculté d’interdire (i) l’extraction et la réutilisation « de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu d'une base de données sur un autre support », et/ou (ii) « l’extraction ou la réutilisation répétée et systématique de parties qualitativement ou quantitativement non substantielles du contenu de la base lorsque ces opérations excèdent manifestement les conditions d'utilisation normale de la base de données ».
- Les investissements substantiels
En l’espèce, la Cour de Cassation considère que peuvent être retenus :
- au titre d'un investissement lié à l'obtention du contenu de la base de données, les investissements de communication comme ayant pour but de rechercher et de collecter un grand nombre d'annonces auprès d'internautes ;
- au titre d'un investissement lié à la vérification du contenu de la base de données, les dépenses afférentes au logiciel serenity, les opérations de vérification des annonces du site leboncoin.fr étant effectuées, d'une part, une fois que l'annonce est déposée par l'annonceur, par l'intermédiaire de ce logiciel de filtrage, d'autre part, a posteriori, par une équipe chargée de la modération ;
- au titre d'un investissement lié à la présentation du contenu de la base de données, les dépenses liées à la classification des annonces, laquelle est opérée selon dix catégories qui sont ensuite divisées en sous-catégories, puis en critères de recherche spécifiques pour chaque sous-catégorie, selon une arborescence détaillée qui rassemble et organise près de vingt-huit millions d'annonces avec une moyenne de huit cent mille nouvelles annonces quotidiennes, la base étant mise à jour et en conformité par l'équipe « produits ».
2. La question de la sous-base de données
Le défendeur soutenait qu’une sous-base de données (ie les annonces immobilières) n'est éligible à la protection du droit sui generis qu'autant qu'elle résulte, en elle-même d'investissements financiers, matériels et humains substantiels propres et autonomes au sens de l'article L. 341-1 du Code de la propriété intellectuelle.
La Cour de Cassation ne suit pas ce raisonnement considérant que la part d’investissement se rapportant au contenu de cette sous-base de données, dont le volume d’annonces représentait 10% du volume total, pouvait être évaluée à 10% des investissements substantiels engagés pour la constitution, la vérification et la présentation de la base de données se rapportait au contenu de la sous-base de données.
3. Simple indexation ou web scraping?
Le défendeur soutenait que du fait que le renvoi vers la une base de données de la Société par la mention d'un lien hypertexte constitue une indexation et non une extraction illicite.
Après avoir relevé que le site litigieux reprenait toutes les informations relatives au bien immobilier, s'agissant de la localisation, la surface, le prix, la description et la photographie du bien, qui sont les critères essentiels des annonces du site leboncoin.fr, la Cour de Cassation a considéré que tels agissements constituaient une extraction illicite.
* * * * *
Outre la possible sanction au titre des CGU d’un site internet, la pratique du web scraping peut donc être sanctionnée au titre de la violation des droits du producteur de base de données, sous réserve que ce dernier remplisse les critères y attachés.