Abstract:
La transformation automatique des ressources Web dans un format spécifique consiste à
extraire des données web ou web scraping. L'extraction des données Web se fait à l'aide des
langages de programmation backend, en accédant au site Web avec un client http et en extrayant
les données en adressant les balises, les classes, les identifiants du document qui décrit la page.
Plusieurs fois, le web scraping est effectué à des fins d'analyse et de collecte d'informations à partir
de plusieurs sources en un seul endroit. Le but principal de cet article était de familiariser et
d'expliquer ce qu'est le scraping Web, comment il est utilisé, les techniques, quels objectifs et
comment les administrateurs de sites Web peuvent être protégés contre la collecte automatique de
données.