en | nl
Data Science Workshops

Samen bereik je meer met data dankzij mijn workshop Data Science met Python en Spark. Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Stuur me vooral een bericht.

Data Science met Python en Spark

Apache Spark is een open source gedistribueerde engine voor het opvragen en verwerken van data. In deze driedaagse hands-on workshop leer je hoe je Spark vanuit Python (PySpark) kunt gebruiken om grote hoeveelheden data te verwerken.

Na een overzicht van de Spark architectuur, beginnen we met het manipuleren van Resilient Distributed Datasets (RDD’s) om vervolgens de overstap te maken naar Spark DataFrames. Het concept van lazy evaluation wordt in detail besproken en we demonstreren verschillende transformaties en acties die specifiek zijn voor RDD’s en DataFrames. Je leert hoe DataFrames kunnen worden gemanipuleerd met behulp van SQL query’s.

We laten je zien hoe je supervised machine learning algoritmen toepast, zoals lineaire regressie, logistische regressie, beslisbomen en random forests. Je leert ook over unsupervised machine learning algoritmen zoals PCA en K-means clustering.

Aan het einde van deze workshop heb je een goed begrip van het verwerken van data met PySpark en begrijp je hoe je Spark’s machine learning-bibliotheek kunt gebruiken om verschillende machine learning-modellen te bouwen.

Leerdoelen

Deze workshop is voor jou omdat

Programma

Dag 1:

Dag 2:

Dag 3:

Voorkennis

Er wordt verwacht dat je bekend bent met de volgende Python-syntaxis en -concepten:

Enige ervaring met Pandas en SQL is handig, maar niet vereist.

Voorbereiding

Deelnemers wordt vriendelijk verzocht om voor aanvang van de workshop de volgende zaken te installeren:

Na aanmelding ontvangt je per e-mail meer gedetailleerde installatie-instructies.

Ik heb eerder deze workshop verzorgd voor

ProRail
KPN ICT Consulting
Textkernel

Meld je aan voor mijn nieuwsbrief

Blijf op de hoogte van nieuwe workshops, aankomende evenementen en ander nieuws over mijzelf en Data Science Workshops.

Interesse?

Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Vul dit formulier in, stuur een e-mail naar jeroen@datascienceworkshops.com of bel me op 06-19628479 en ik kom binnen 24 uur bij je terug.