SparklyR – Grote datasets (of Big Data) analyseren met Spark en R

SparklyR – Grote datasets (of Big Data) analyseren met Spark en R

Intro Een aantal weken geleden heeft RStudio het R package SparklyR uitgebracht. Dit package maakt het mogelijk om op een eenvoudige manier grote datasets, of zelfs data hoeveelheden onder de noemer Big Data, met R te analyseren met behulp van de technologie van Apache Spark. In dit artikel wil ik dat met een voorbeeld demonstreren. Hier heb ik een dataset van […]

Gratis online cursus R . Data analyseren en Programmeren met R.

Gratis online cursus R . Data analyseren en Programmeren met R.

 Fantastische data analyses met R Ga direct naar: Download R cursus PDF E-book en website R cursus R is de open source statistische programmeertaal waarmee je op een fantastische manier data kunt analyseren. Van eenvoudige calculaties tot uitgebreide statistische analyses kun je waardevolle inzichten halen uit data met behulp van R. Daarbij wordt R op […]

Microsoft Azure Batch en R – Doorlooptijden terugbrengen van Dagen naar Uren

Microsoft Azure Batch en R – Doorlooptijden terugbrengen van Dagen naar Uren

Veel input data, lange wachttijden De definitie van Big Data is in de loop der tijd bij steeds meer bedrijven doorgedrongen. Veel mensen kunnen op dit moment wel een definitie van Big Data bedenken. Een voorbeeld van een eenvoudige definitie is: ”Data dat te omvangrijk is om op een enkele machine op te slaan of […]

De ontwikkeling van films over de laatste 100 jaar. Verteld door een analyse van 50.000+ films uit de IMDB-database in R

De ontwikkeling van films over de laatste 100 jaar. Verteld door een analyse van 50.000+ films uit de IMDB-database in R

Films op IMDB Ik ben een grote liefhebber van films. Van een mooi plot en goed acteerwerk kan ik echt genieten. Daarnaast is het natuurlijk gewoon chill om af en toe een filmpje te pakken. IMDB is de website die ik veel gebruik om o.a. even te checken welke acteurs er in spelen en welke […]