Introduction to statistics and programming for data science

Next Date:
04.10.2024
Course ends on:
15.11.2024
Total Duration:
150 Stunden in 44 Tagen
Internship:
Nein
Teaching Languages:
  • Englisch
Type of Course:
  • Weiterbildung 
Type of Provision:
  • Virtuelles Klassenzimmer 
Execution Time:
  • Tagesveranstaltung
min. Participants:
keine Angaben
max. Participants:
20
Price:
€4,350 - Unterkunft und Verpflegung sind im Preis nicht enthalten.
Funding:
  • Bildungszeit/-freistellung 
    Veranstaltung ist gemäß § 10 Berliner Bildungszeitgesetz anerkannt.
Type of Qualification:
Zertifikat/Teilnahmebestätigung 
Final Examination:
Ja
Qualification Title:
TU Berlin Certificate of Professional Education
Certifications of the Course:
  • Nicht zertifiziert
Courses for Women only:
Nein
Childcare:
Nein
Link to Course:
Quantity of Details:
Suchportal Standard nicht erfüllt - further information

Target Groups:
keine Angaben
Professional Requirements:
Englisch auf B1-Niveau; Vorkenntnisse in Programmierung und Statistik; Grundlagen in Mathematik; Beherrschung der Microsoft Office-Anwendungen
Technical Requirements:
Laptop/PC + Headset mit Mikrofon
Classification of the Federal Employment Agency:
keine Angaben

Contents

Der Zertifikatskurs vermittelt intensiv die Grundlagen der Statistik und Programmierung für die Datenwissenschaft. Er behandelt die Grundlagen der deskriptiven und inferentiellen Statistik sowie die Grundlagen der Programmierung für die Datenanalyse. Teilnehmende lernen, wie sie die Sprache R/Python zur Datenanalyse und zur Erstellung von Datenvisualisierungen einsetzen können.

THEMEN
Woche 1: Kursvorbereitung - Software installieren
- Was sind R und RStudio? Was sind Python und Jupyter (Notebook)?
- Installation von R und RStudio / Python und Jupyter (Notebook) auf dem persönlichen Laptop/Computer
- Fehler, Warnungen und Nachrichten
- Lerntipps zum Coden
- Package-Installation
- Package-Loading
- Testen und Hello-World-Programm

Woche 2: Einführung ins Programmieren
- Thema 1: Data Typen
- Thema 2: Basic Operations
- Thema 3: Datenstruktur
- Programmierübung 1

Woche 3: Überblick über Programmierstatistiken
- Thema 4: Datentypen
- Thema 5: Explorative Datenanalyse
- Thema 6: Statistische Analyse mit Excel
- Programmierübung 2

Woche 4: Datenmanipulation und -bereinigung
- Thema 7: Datenrahmenoperationen
- Thema 8: Input und Output mit R/Python
- Thema 9: Datenumformung
- Programmierübung 3

Woche 5: Datenexploration und -visualisierung
- Thema 10: Umgang mit fehlenden Daten
- Thema 11: Erforschung und Visualisierung von Techniken
- Thema 12: Visualisierung von Daten mit R/Python
- Programmierübung 4

Woche 6: Capstone Projekt
- Anwendung der im Kurs erlernten Fähigkeiten und Kenntnisse auf ein reales Datenanalyseprojekt mit R/Python
- Prüfungsprojekt Anforderung und Spezifikation
- 4 Stunden offene Sprechstunde (in Gruppen) - online

LERNZIELE
Nach erfolgreichem Abschluss des Kurses wissen Teilnehmende, wie Daten mit R/Python-Paketen importiert, exportiert und manipuliert werden und verstehen grundlegende statistische Konzepte und Techniken sowie deren Berechnung in R/Python. Sie sind in der Lage verschiedene Arten von Plots und Diagrammen mit Hilfe von R-Visualisierungspaketen zu erstellen und anzupassen. Sie sind geübt im Umgang mit verschiedenen Arten von Plots und Diagrammen unter Verwendung von Excel als ergänzende Werkzeuge für die Statistik und können R/Python verwenden, um einfache statistische Analysen, Hypothesentests und Datenexploration durchzuführen. Datenbereinigung, Datentransformation und Datenaufbereitung mit R/Python können sie eigenständig durchführen und kennen Techniken zur Datenvorverarbeitung, -bereinigung und -aufbereitung.

All statements without guarantee. The providers are solely responsible for the correctness of the given information.

Published on 28.09.2023, last updated on 21.05.2024