en | nl

Data Science Workshops

Samen bereik je meer met data.

Jeroen traint en ondersteunt programmeurs, analisten, onder­zoekers en managers in Python, R, data science, statistiek en machine learning. Zijn aanpak is prak­tisch en on­ge­dwong­en, maar ook duur­zaam. Zowel online als op locatie.

Python workshops

Programmeren in Python
Programmeren in Python

In deze tweedaagse workshop helpen we je op weg om te leren programmeren in Python, een van de meest populaire talen voor scripts, productiesoftware en data science.

Aan de hand van realistische voorbeelden maak je kennis met verschillende fundamentele programmeerconcepten, zoals variabelen, functies en control flow. De workshop zal hands-on zijn, met uitdagende oefeningen. Uniek aan deze workshop is dat we JupyterLab gebruiken, een populaire omgeving om interactief code uit te voeren en data science te doen.

Deze workshop bereidt je niet alleen voor op meer geavanceerde Python workshops, maar biedt je ook een solide en betrouwbare basis voor jouw data science reis.

2 dagen
online of op locatie
Data Analyse met Python en Pandas
Data Analyse met Python en Pandas

Leer hoe je jouw data analyses kunt versnellen met Pandas, een Python pakket die speciaal is ontworpen voor het werken met middelgrote datasets. Samen met JupyterLab maakt het een handige omgeving voor interactieve data analyse mogelijk.

Pandas maakt deel uit van het zogenaamde PyData-ecosysteem, en in deze workshop beginnen we met het geven van een overzicht van PyData en leggen we uit waar Pandas staat en hoe het samenwerkt met andere pakketten zoals NumPy en Seaborn. Pandas introduceert een paar nieuwe datastructuren, met name het DataFrame, die essentieel zijn om te begrijpen hoe efficiënt met tabelgegevens kan worden gewerkt.

Pandas biedt veel functies, en in een dag, door een goede balans tussen presentatie en interactieve oefeningen, gaan we de belangrijkste behandelen, waaronder: importeren, filteren, groeperen, samenvoegen, verkennen en visualiseren van gegevens. Aan het einde van deze workshop begrijp je de grondbeginselen van Pandas, ben je je bewust van veelvoorkomende valkuilen en ben je klaar om je eigen analyses uit te voeren.

1 dag
online of op locatie
Webscrapen en Crawlen met Python
Webscrapen en Crawlen met Python

Het internet is niet alleen een verzameling webpagina’s, het is een gigantische bron van interessante gegevens. Automatisch deze gegevens kunnen extraheren is een waardevolle vaardigheid. Het is zeker uitdagend, maar met de juiste kennis en tools kun je een schat aan informatie gebruiken voor je persoonlijke en professionele data science projecten.

Stel je voor dat je een webscraper bouwt die legaal informatie verzamelt over potentiële huizen om te kopen, een proces dat automatisch dat vervelende formulier invult om een rapport te downloaden, of een crawler die een bestaande dataset verrijkt met weersinformatie. In deze hands-on workshop leren we je hoe je dat kunt bereiken met Python en een handvol packages.

Je leert over de concepten die ten grondslag liggen aan HTML, CSS-selectors en HTTP-verzoeken; en hoe je deze kunt inspecteren met behulp van de ontwikkelaarstools van de browser. We laten je zien hoe je rommelige HTML kunt omzetten in gestructureerde datasets, hoe je de interactie met dynamische websites en formulieren kunt automatiseren en hoe je crawlers kunt opzetten die duizenden of miljoenen websites kunnen doorspitten. Door tal van oefeningen ben je in staat om deze nieuwe kennis in een mum van tijd toe te passen op je eigen projecten.

1 dag
online of op locatie
Machine Learning met Python
Machine Learning met Python

Machine learning is een essentieel onderdeel geworden in veel applicaties en projecten waarbij data betrokken zijn. Met de kracht van Python en het scikit-leerpakket is dit spannende vakgebied niet langer exclusief voor grote bedrijven met uitgebreide onderzoeksteams. Als je Python gebruikt, zelfs als beginner, worden machine learning-toepassingen alleen beperkt door jouw verbeeldingskracht.

Tijdens deze workshop zullen we een hands-on benadering hanteren om te leren over machine learning algoritmen. Onderwerpen zijn onder meer: regressie, classificatie, outlier detectie, dimensionaliteitsreductie en clustering. Gedurende twee dagen zullen we verschillende algoritmen verkennen, zoals lineaire regressie, logistische regressie, random forests, neurale netwerken en nog veel meer.

Aan het einde van deze workshop zul je vol vertrouwen machine learning-algoritmen selecteren en gebruiken met behulp van Python en scikit-learn. Je hebt een beter begrip gekregen van de werking van de algoritmen en weet hoe je deze kunt gebruiken om waardevolle resultaten en inzichten te produceren.

2 dagen
online of op locatie
Data Science met Python en Spark
Data Science met Python en Spark

Apache Spark is een open source gedistribueerde engine voor het opvragen en verwerken van data. In deze driedaagse hands-on workshop leer je hoe je Spark vanuit Python (PySpark) kunt gebruiken om grote hoeveelheden data te verwerken.

Na een overzicht van de Spark architectuur, beginnen we met het manipuleren van Resilient Distributed Datasets (RDD’s) om vervolgens de overstap te maken naar Spark DataFrames. Het concept van lazy evaluation wordt in detail besproken en we demonstreren verschillende transformaties en acties die specifiek zijn voor RDD’s en DataFrames. Je leert hoe DataFrames kunnen worden gemanipuleerd met behulp van SQL query’s.

We laten je zien hoe je supervised machine learning algoritmen toepast, zoals lineaire regressie, logistische regressie, beslisbomen en random forests. Je leert ook over unsupervised machine learning algoritmen zoals PCA en K-means clustering.

Aan het einde van deze workshop heb je een goed begrip van het verwerken van data met PySpark en begrijp je hoe je Spark’s machine learning-bibliotheek kunt gebruiken om verschillende machine learning-modellen te bouwen.

3 dagen
online of op locatie

R workshops

Programmeren in R
Programmeren in R

R is een statistische omgeving en programmeertaal die veel wordt gebruikt door statistici en data scientists om met data te werken. Deze eendaagse workshop zal je gids zijn en je op weg helpen met verschillende programmeeraspecten van R.

Je leert werken met krachtige R technieken en concepten. Je zult je productiviteit verhogen met de meest populaire R-pakketten en datastructuren zoals dataframes, lijsten en matrices. We leren je hoe je vectoren maakt, variabelen afhandelt en andere kernfuncties uitvoert. Je zult data uit verschillende bronnen inlezen.

Vervolgens zullen we meer geavanceerde concepten behandelen, zoals metaprogrammeren met R en functioneel programmeren. Ten slotte krijg je een beeld van R’s mogelijkheden voor datavisualisatie en datamanipulatie.

1 dag
online of op locatie
Data Transformeren met R en de Tidyverse
Data Transformeren met R en de Tidyverse

In deze eendaagse hands-on workshop leidt RStudio-gecertificeerde instructeur Jeroen Janssens je door de zogenaamde Tidyverse om data te transformeren. De Tidyverse is een ecosysteem van R-pakketten die een onderliggende ontwerpfilosofie, grammatica en datastructuren delen.

We beginnen bij het begin, met het importeren van CSV-gegevens met readr en spreadsheets met readxl. We zullen de belangrijkste functies van dplyr en tidyr behandelen voor data transformaties en opschoning. We zullen ook kijken naar het omgaan met datums, factoren en tekstuele data, specifiek met behulp van respectievelijk de pakketten lubridate, forcats en stringr. Merk op dat deze workshop ggplot2 niet behandelt; daarvoor raden we onze eendaagse workshop Data Visualisatie met R en ggplot2 aan.

Aan het einde van deze workshop heb je een goed begrip van het Tidyverse ecosysteem en kun je veel van zijn pakketten toepassen op je eigen data.

1 dag
online of op locatie
Data Visualisatie met R en ggplot2
Data Visualisatie met R en ggplot2

In deze eendaagse hands-on workshop gaan we ggplot2, een veelgebruikt R-pakket dat de zogenaamde grammar of graphics implementeert, onder de loep nemen. Dankzij de beknopte en consistente syntaxis kunt je op een snelle en iteratieve manier hoogwaardige datavisualisaties maken die geschikt zijn voor zowel exploratie als communicatie.

Aan het einde van deze workshop heb je een goed begrip van de basisprincipes en je datavisualisaties in R kunt maken voor je dagelijkse werk. Maar let op: de kans is groot dat je meer wilt weten over R.

1 dag
online of op locatie

Andere populaire workshops

Data Science op de Command Line
Data Science op de Command Line

De unix command line, hoewel decennia geleden uitgevonden, is een geweldige omgeving voor het efficient uitvoeren van essentiele data scinece taken. Door kleine, krachtige tools (zoals parallel, jq en csvkit) te combineren, kun je snel jouw data opschonen en verkennen.

Deze hands-on workshop is gebaseerd op het O’Reilly boek Data Science at the Command Line, geschreven door instructeur Jeroen Janssens. Je leert hoe je snelle data pijplijnen bouwt, hoe je R en Python gebruikt op de command line en hoe je snel data visualiseert. Er is geen voorkennis over unix vereist.

Aan het einde van deze workshop heb je een goed begrip van hoe je de command line kunt integreren in je data science-workflow. Zelfs als je al vertrouwd bent met het verwerken van data met bijvoorbeeld R of Python, zal het kunnen gebruiken van de kracht van de opdrachtregel je een effectievere en efficientere datawetenschapper maken.

2 dagen
online of op locatie
Onder de Motorkap van Data Science
Onder de Motorkap van Data Science

Vraag twaalf mensen wat “data science” betekent, en je krijgt dertien verschillende antwoorden terug. Deze vaagheid gaat helaas gepaard met veel hype en verkeerde verwachtingen. In deze inspiratiesessie willen we dit oplossen door eens goed onder de motorkap van data science te kijken.

In drie uur leggen we niet alleen in heldere bewoordingen uit wat data science inhoudt, maar laten we deelnemers ook ervaren wat een typische data scientist doet door een praktische use case door te werken met behulp van een echte dataset en een programmeertaal zoals Python of R. Deze sessie is bedoeld voor iedereen die wil weten waar data science over gaat (en waarover niet). Zelfs als je nooit van plan bent om zelf met data te werken, kan het een eye-opener zijn om het te hebben meegemaakt. Let op: de kans bestaat dat je daarna meer wilt weten!

3 uur
online of op locatie
Versiebeheer met Git en GitHub
Versiebeheer met Git en GitHub

Beschrijving wordt binnenkort toegevoegd.

1 dag
online of op locatie

Ervaringen van deelnemers

De 5-daagse workshop Data Science met R gaf ons een kijkje in de mogelijkheden die R te bieden heeft. Tijdens de workshop zijn we onder begeleiding van Jeroen aan de slag gegaan met actuele lopende projecten, zeer verhelderend. Jeroen heeft ons veel praktijkvoorbeelden en tips gegeven. We zijn er nog niet helemaal, maar Data Science Workshops heeft ons een voorsprong gegeven!

Arjen Verhulst
Analyst bij Gemeente Nijmegen

Ik heb veel van de incompany workshop Programmeren in Python geleerd, en vond het knap dat Jeroen rond onze specifieke leerwensen kon improviseren en zo precies dat aanbood wat we wilden leren zonder dat het te moeilijk werd. Ook was het leerzaam om te zien welke verschillende oplossingen er waren voor een bepaalde oefening, en wat daar wel en niet “goed” of handig aan was—dat is nou precies iets wat je met zelfstudie heel lastig kunt oppikken.

Floor Buschenhenke
PhD Candidate bij Huygens ING (KNAW)

De Anomalie Detectie masterclass van Jeroen heeft ons zeer bruikbare tools opgeleverd om business vraagstukken aan te pakken waarbij (vroegtijdige) detectie van anomalieën van het grootste belang is. Denk bijvoorbeeld aan vroege detectie van DDoS-aanvallen, kredietfraude of verzekeringsfraude. Aanbevolen!

Rik Kleine
Data Science Consultant bij KPN ICT Consulting

Geweldige training! Zeer goed gedaan en zeer nuttige informatie geleverd op een uitstekende en interactieve manier. Jeroen anticipeerde heel goed op de verschillende kennisniveaus binnen de groep. Ik zou de Data Science at the Command Line-workshop ten zeerste aanbevelen aan iedereen die geïnteresseerd is in het verbeteren van hun data science vaardigheden met Unix power tools.

Sanne Bouwman
Data Scientist bij Teradata

Bij Brabant Water gebruikten de meesten van ons nog spreadsheets om onze gegevens op te schonen, te analyseren en te modelleren. Dankzij Jeroen, die een boeiende, praktische workshop op ons kantoor heeft gegeven, zijn velen van ons overgestapt op Python en Jupyter Notebook, waardoor onze analyses veel geavanceerder en betrouwbaarder zijn.

Stijn de Jong
Senior Advisor Water Supply bij Brabant Water

Het volgen van de op maat gemaakte cursus Data Manipuleren met Pandas bij Textkernel is een uitstekende keuze gebleken. Jeroen’s persoonlijke benadering en zeer interactieve manier van lesgeven maakte deze cursus waardevol voor een diverse groep ontwikkelaars en analisten, evenals de mogelijkheid om theorie toe te passen op onze eigen data en API tijdens de cursussen. Sindsdien heb ik beter en efficiënter kunnen programmeren en heb ik het pandas-pakket in verschillende monitoring- en analysescripts toegepast.

Karlijn Dinnissen
Data Quality Analyst bij Textkernel

Data Science Workshops organiseerde een training op het Xomnia kantoor in Amsterdam over webscraping met behulp van R en het rvest-pakket. We hebben alle kennis en vaardigheden opgedaan die nodig zijn om de theorie succesvol in de praktijk te brengen. Daarnaast inspireerde deze training mij om het maximale uit R te halen door gebruik te maken van de verschillende pakketten uit de Tidyverse.

Boris Stapel
Trainee Data Scientist bij Xomnia

Zelfs ervaren datawetenschappers moeten blijven werken aan hun vaardigheden en kennis. Sinds een half jaar komt Data Science Workshops één keer per maand naar ons kantoor om ons te leren over een verscheidenheid aan onderwerpen, variërend van NoSQL tot t-SNE. Dit is een geweldige manier om bij te blijven en verder te kijken dan de tools en technieken waarmee je al bekend mee bent.

Anne-Marie Dekkers
Data Scientist bij ProRail

Over Jeroen

Dr. Jeroen Janssens is een data science consultant en gecertificeerd docent. Zijn expertise ligt in het visualiseren van data, het implementeren van machine learning-modellen en het ontwikkelen van software met Python, R, JavaScript en Bash. Hij is gepassioneerd in het helpen van anderen om zulke dingen te doen.

Jeroen runt sinds 2013 Data Science Workshops B.V., een trainings- en coachingsbureau dat incompany trainingen, workshops op basis van open inschrijving, inspiratiesessies, hackathons en meetups organiseert. Klanten zijn onder meer KPN, Rabobank, ProRail, Transavia en T-Mobile.

Daarvoor was hij universitair docent aan de Jheronimus Academy of Data Science en data scientist bij Elsevier in Amsterdam en verschillende startups in New York City. Hij is de auteur van Data Science at the Command Line (O’Reilly Media, 2021). Jeroen heeft een PhD in machine learning van Tilburg University en een MSc in kunstmatige intelligentie van Universiteit Maastricht.

Hij woont met zijn vrouw en twee kinderen in Rotterdam. Als je meer wilt weten over zijn diensten, honorarium en beschikbaarheid, neem dan contact op met Jeroen. Je kunt hem ook vinden op Twitter, GitHub en LinkedIn.

Meld je aan voor mijn nieuwsbrief

Blijf op de hoogte van nieuwe workshops, aankomende evenementen en ander nieuws over mijzelf en Data Science Workshops.

Een greep uit Jeroens klanten

Tientallen organisaties vertrouwen Jeroen om hun programmeurs, analisten, onderzoekers en managers te trainen en te ondersteunen zodat zij meer kunnen bereiken met data.

Amazon
DPD
Elsevier
Gemeente Nijmegen
KPN
OHRA
ProRail
Rabobank
Schiphol Amsterdam Airport
Squla
T-Mobile
The New York Times
TNO
Transavia
TU Delft

Ervaringen van managers

Jeroen organiseerde voor KPN een tienweekse cursus Data Science met R. De combinatie van training, coaching op locatie en ondersteuning op afstand zorgde ervoor dat onze analisten de nieuwe kennis en vaardigheden toepassen in hun dagelijkse projecten. Zo zijn ze nu in staat om complexe voorspelmodellen te implementeren met R. We kijken uit naar de vervolgcursus Advanced Machine Learning.

Wouter Egberink
Manager Commercial Analytics bij KPN

Data Science Workshops faciliteerde een data hackathon voor het datateam van Transavia. Ze zorgden ervoor dat het inspirerend en nuttig was. Het leidde tot waardevolle inzichten in de manier van werken met Python voor meerdere projecten en analyses die Transavia momenteel uitvoert.

Charles Verstegen
Head of Partner Sales and Data & Analytics bij Transavia

We kregen een persoonlijke coachingsessie van Jeroen en dit was zeer waardevol voor mij. Het is zo’n vaardigheid om het niveau van de deelnemers correct in te schatten, maar dit is terecht gedaan en de training was perfect aangepast aan onze behoeften. Onze opleiding had een praktische focus en die konden we als uitgangspunt gebruiken voor de rest van ons werk. Deze training gaf ons de tools en denkwijze om de data-analyses zelfstandig uit te voeren.

Mirthe Groothuis
Project Lead bij Dutch Institute for Clinical Auditing

Besides demonstrating a good knowledge and experience in command-line tools for data science, the instructor had very good training skills, clear communication, and managed to adapt the level of the training to the level of the audience, which is not always easy!

Marc Canaleta
CTO bij Social Point

Ons DataLab team heeft genoten van een driedaagse PySpark cursus van Jeroen. Jeroen’s aanpak is persoonlijk en professioneel. Ik raad Data Science Workshops aan iedereen aan op het gebied van data science.

Laurens Koppenol
Lead Data Scientist bij ProRail

Data Science Workshops was in staat om vakkundig te differentiëren door verschillende Unix Consultants bij Snow aan te spreken met zeer verschillende vaardigheden. Jeroen liet sommige mensen boven zichzelf uitstijgen.

Joost Helberg
CTO bij Snow

Ons Insight & Analytics team heeft een vijfweekse cursus R gevolgd van Jeroen. De training was opgebouwd rond onze eigen data en uitdagingen en was daarom gemakkelijk toepasbaar in onze dagelijks werk. De sfeer tijdens de trainingsdagen was altijd erg gezellig en iedereen kijkt terug op een zeer geslaagde training.

Yannick Jacobs
Manager Insight & Analytics bij DPD

Before the six-day workshop with Data Science Workshops, our team of engineers only had some theoretical knowledge of data science and we primarily used costly tools such as Tableau to do data analysis. However, after four days of interactive hands-on sessions with Jeroen, we were able to use Python, our preferred programming language at eHealth Africa, to analyse our data, create some amazing visualisations and even start making machine learning predictions. We moved from theory to real application in a very short period of time, making this workshop extremely valuable. I highly recommend Data Science Workshops.

Aboubacar Sidiki Douno
Senior Software Engineering Manager bij eHealth Africa

Ik hoor graag van je.

Wil je meer weten over mijn workshops en andere diensten? Benieuwd hoe ik te werk ga? Andere vraag? Vul dit formulier in, stuur een e-mail naar jeroen@datascienceworkshops.com of bel me op 06-19628479 en ik kom binnen 24 uur bij je terug.