en | nl
Data Science Workshops

Laten we samen meer bereiken met data met mijn workshop Webscrapen en Crawlen met Python. Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Stuur me vooral een bericht.

Webscrapen en Crawlen met Python

Het internet is niet alleen een verzameling webpagina’s, het is een gigantische bron van interessante gegevens. Automatisch deze gegevens kunnen extraheren is een waardevolle vaardigheid. Het is zeker uitdagend, maar met de juiste kennis en tools kun je een schat aan informatie gebruiken voor je persoonlijke en professionele data science projecten.

Stel je voor dat je een webscraper bouwt die legaal informatie verzamelt over potentiële huizen om te kopen, een proces dat automatisch dat vervelende formulier invult om een rapport te downloaden, of een crawler die een bestaande dataset verrijkt met weersinformatie. In deze hands-on workshop leren we je hoe je dat kunt bereiken met Python en een handvol packages.

Je leert over de concepten die ten grondslag liggen aan HTML, CSS-selectors en HTTP-verzoeken; en hoe je deze kunt inspecteren met behulp van de ontwikkelaarstools van de browser. We laten je zien hoe je rommelige HTML kunt omzetten in gestructureerde datasets, hoe je de interactie met dynamische websites en formulieren kunt automatiseren en hoe je crawlers kunt opzetten die duizenden of miljoenen websites kunnen doorspitten. Door tal van oefeningen ben je in staat om deze nieuwe kennis in een mum van tijd toe te passen op je eigen projecten.

Leerdoelen

Deze workshop is voor jou omdat

Programma

Voorkennis

Er wordt van je verwacht dat je enige ervaring hebt met programmeren in Python. Onze workshop Programmeren in Python is een optie die je daarbij kan helpen. Grofweg gesproken, als je bekend bent met de volgende Python-syntaxis en -concepten, komt het goed:

Enige ervaring met HTML en CSS is handig, maar niet vereist.

Voorbereiding

We gaan Python gebruiken samen met JupyterLab en de volgende packages:

De aanbevolen manier om alles te installeren is als volgt:

Als alternatief, als je Anaconda niet wilt gebruiken, dan kun je alles installeren met pip. Wanneer het uitvoeren van import bs4, mechanize, pyquery, scrapy, selenium geen fouten oplevert, weet je dat je alles correct hebt geinstalleerd.

Daarnaast heb je een recente versie van Firefox of Chrome nodig zodat we HTTP-verzoeken en HTML-elementen kunnen inspecteren.

Ik heb eerder deze workshop verzorgd voor

Elsevier
Rabobank
KPN
ProRail

Meld je aan voor mijn nieuwsbrief

Blijf op de hoogte van nieuwe workshops, aankomende evenementen en ander nieuws over mijzelf en Data Science Workshops.

Interesse?

Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Vul dit formulier in, stuur een e-mail naar jeroen@datascienceworkshops.com of bel me op 06-19628479 en ik kom zo snel mogelijk bij je terug.