Introduction to statistics and programming for data science

Nächster Termin:
04.10.2024
Kurs endet am:
15.11.2024
Gesamtdauer:
150 Stunden in 44 Tagen
Praktikum:
Nein
Unterrichtssprachen:
  • Englisch
Veranstaltungsart:
  • Weiterbildung 
Angebotsform:
  • Virtuelles Klassenzimmer 
Durchführungszeit:
  • Tagesveranstaltung
Teilnehmer min.:
keine Angaben
Teilnehmer max.:
20
Preis:
4.350 € - Unterkunft und Verpflegung sind im Preis nicht enthalten.
Förderung:
  • Bildungszeit/-freistellung 
    Veranstaltung ist gemäß § 10 Berliner Bildungszeitgesetz anerkannt.
Abschlussart:
Zertifikat/Teilnahmebestätigung 
Abschlussprüfung:
Ja
Abschlussbezeichnung:
TU Berlin Certificate of Professional Education
Zertifizierungen des Angebots:
  • Nicht zertifiziert
Angebot nur für Frauen:
Nein
Kinderbetreuung:
Nein
Link zum Angebot:
Infoqualität:
Suchportal Standard nicht erfüllt - Weitere Informationen

Zielgruppen:
keine Angaben
Fachliche Voraussetzungen:
Englisch auf B1-Niveau; Vorkenntnisse in Programmierung und Statistik; Grundlagen in Mathematik; Beherrschung der Microsoft Office-Anwendungen
Technische Voraussetzungen:
Laptop/PC + Headset mit Mikrofon
Systematik der Agenturen für Arbeit:
keine Angaben

Inhalte

Der Zertifikatskurs vermittelt intensiv die Grundlagen der Statistik und Programmierung für die Datenwissenschaft. Er behandelt die Grundlagen der deskriptiven und inferentiellen Statistik sowie die Grundlagen der Programmierung für die Datenanalyse. Teilnehmende lernen, wie sie die Sprache R/Python zur Datenanalyse und zur Erstellung von Datenvisualisierungen einsetzen können.

THEMEN
Woche 1: Kursvorbereitung - Software installieren
- Was sind R und RStudio? Was sind Python und Jupyter (Notebook)?
- Installation von R und RStudio / Python und Jupyter (Notebook) auf dem persönlichen Laptop/Computer
- Fehler, Warnungen und Nachrichten
- Lerntipps zum Coden
- Package-Installation
- Package-Loading
- Testen und Hello-World-Programm

Woche 2: Einführung ins Programmieren
- Thema 1: Data Typen
- Thema 2: Basic Operations
- Thema 3: Datenstruktur
- Programmierübung 1

Woche 3: Überblick über Programmierstatistiken
- Thema 4: Datentypen
- Thema 5: Explorative Datenanalyse
- Thema 6: Statistische Analyse mit Excel
- Programmierübung 2

Woche 4: Datenmanipulation und -bereinigung
- Thema 7: Datenrahmenoperationen
- Thema 8: Input und Output mit R/Python
- Thema 9: Datenumformung
- Programmierübung 3

Woche 5: Datenexploration und -visualisierung
- Thema 10: Umgang mit fehlenden Daten
- Thema 11: Erforschung und Visualisierung von Techniken
- Thema 12: Visualisierung von Daten mit R/Python
- Programmierübung 4

Woche 6: Capstone Projekt
- Anwendung der im Kurs erlernten Fähigkeiten und Kenntnisse auf ein reales Datenanalyseprojekt mit R/Python
- Prüfungsprojekt Anforderung und Spezifikation
- 4 Stunden offene Sprechstunde (in Gruppen) - online

LERNZIELE
Nach erfolgreichem Abschluss des Kurses wissen Teilnehmende, wie Daten mit R/Python-Paketen importiert, exportiert und manipuliert werden und verstehen grundlegende statistische Konzepte und Techniken sowie deren Berechnung in R/Python. Sie sind in der Lage verschiedene Arten von Plots und Diagrammen mit Hilfe von R-Visualisierungspaketen zu erstellen und anzupassen. Sie sind geübt im Umgang mit verschiedenen Arten von Plots und Diagrammen unter Verwendung von Excel als ergänzende Werkzeuge für die Statistik und können R/Python verwenden, um einfache statistische Analysen, Hypothesentests und Datenexploration durchzuführen. Datenbereinigung, Datentransformation und Datenaufbereitung mit R/Python können sie eigenständig durchführen und kennen Techniken zur Datenvorverarbeitung, -bereinigung und -aufbereitung.

Alle Angaben ohne Gewähr. Für die Richtigkeit der Angaben sind ausschließlich die Anbieter verantwortlich.

Erstmals erschienen am 28.09.2023, zuletzt aktualisiert am 04.05.2024