SparklyR – Grote datasets (of Big Data) analyseren met Spark en R

SparklyR – Grote datasets (of Big Data) analyseren met Spark en R

Intro Een aantal weken geleden heeft RStudio het R package SparklyR uitgebracht. Dit package maakt het mogelijk om op een eenvoudige manier grote datasets, of zelfs data hoeveelheden onder de noemer Big Data, met R te analyseren met behulp van de technologie van Apache Spark. In dit artikel wil ik dat met een voorbeeld demonstreren. Hier heb ik een dataset van […]

Microsoft Azure Batch en R – Doorlooptijden terugbrengen van Dagen naar Uren

Microsoft Azure Batch en R – Doorlooptijden terugbrengen van Dagen naar Uren

Veel input data, lange wachttijden De definitie van Big Data is in de loop der tijd bij steeds meer bedrijven doorgedrongen. Veel mensen kunnen op dit moment wel een definitie van Big Data bedenken. Een voorbeeld van een eenvoudige definitie is: ”Data dat te omvangrijk is om op een enkele machine op te slaan of […]