12 août 2016

Livre : Web Scraping with Python de Ryan MITCHELL



Définition wikipedia : Le web scraping est une technique d'extraction du contenu de sites Web, via un script ou un programme, dans le but de le transformer pour permettre son utilisation dans un autre contexte, par exemple le référencement ....

Même s'il n'en a pas l'épaisseur, ce livre est une bible. Que vous soyez débutant ou déjà un peu expérimenté en scraping, je vous conseille la lecture de ce livre.

Si comme moi vous êtes convaincu que Python est "le" langage / boite à outil pour le Web Scraping, vous en aurez confirmation dans cet ouvrage.
Tous les aspects techniques sont abordés :
  • les principaux outils (requests, selenium, beautifull soup ...)
  • les outils natifs de python (regex ....)
  • traitement d'images
J'ai pas mal galéré personnellement dans ce domaine, j'ai pris du temps à faire le tour de la question avant de pouvoir construire ma boite à outils et acquérir les connaissances minimales nécessaires, mais c'était avant de connaitre ce livre, avec mon recul je trouve que l'ensemble des problématiques sont abordées dans cet ouvrage et j'aurais gagné pas mal de temps à le lire en premier.

Seul bémol, il est disponible uniquement en Anglais, mais pour la majorité des informaticiens çà ne devrait pas poser trop de soucis.

Aucun commentaire :

Enregistrer un commentaire