Introduktion til moderne dataanalyse i R
Beskrivelse
Datamængderne i private og offentlige offentlige virksomheder vokser dag for dag, og stiller større krav til dataanalyse der er præcis, reproducerbar og genanvendelig, og som kan kommunikeres effektivt videre til kollegaer og kunder. Samtidig revolutionerer machine learning og kunstig intelligens måden hvorpå vi tænker data - men en model er kun så god som den data den er baseret på, og oftest er datahåndtering og raffinering 95% af arbejdet - og måske endda den vigtigste del!
I dette kursus introducerer vi dig til et elegant og state-of-the-art analyseworkflow i analyseværktøjet R, et gratis open-source værktøj, der (sammen med python) er standarden inden for data science og machine learning. Du får de nødvendige kendskaber til at indlæse, analysere og præsentere data. Samtidig introduceres du til god kode- og analyseskik, så dine analyser er reproducerbare og genanvendelige til nye projekter og nyt data. Endelig går du fra kurset med en kvalificeret værktøjskasse og de nødvendige resourcer, så du kan forsætte din rejse med moderne analyse i R.
Kursusindhold
Dag 1
- Hvorfor R?
- Introduktion til R
- Introduktion til RStudio IDE
- Introduktion til RMarkdown og reproducerbarhed
- R-pakker og tidyverse
- Data IO
- Data-oprensning
Dag 2
- Videregående emner i tidyverse
- Avanceret datavisualisering med ggplot
- Videre med R og dataanalyse
Hvem vil have gavn af dette kursus?
Kurset er skræddersyet til medarbejderen, der arbejder eller har et ønske om at arbejde med data dagligt, og gerne vil effektivisere arbejdet med at oprense, analysere og kommunikere disse data. Du behøver ikke have nogle tidligere erfaring med R, men det er en fordel hvis du har arbejdet med data og er superbruger af f.eks. excel. Du kan også have tidligere erfaring med R, men have brug for en opfrisker eller en introduktion til et moderne workflow med tidyverse og dets pakker.