Das SAS basiert auf dem Buch „Statistics for Scientists – A Concise Guide for Data-driven Research“ von Umberto Michelucci (Programmleiter) und verbindet kompakt Theorie, Praxis und ethische Aspekte. Statt einer reinen Formelsammlung steht das Verständnis im Vordergrund: Teilnehmende lernen, wann welche Methode sinnvoll ist und wie sie Ergebnisse korrekt kommunizieren. Praxisnahe Beispiele und Python-Notebooks erleichtern den Transfer in KI-, Data-Science- und Analytics-Projekte.
Modul 1 – Statistisches Denken & Grundlagen
In diesem Modul werden die Grundbegriffe der Statistik eingeführt: Population, Stichprobe, Zufallsvariablen und Outcome Spaces. Die Teilnehmenden lernen den Unterschied zwischen deskriptiver und inferenzieller Statistik kennen und verstehen die Rolle der Statistik in datengetriebenen Projekten. Praxisbeispiele zeigen, wie statistisches Denken Entscheidungen robuster macht.
Modul 2 – Daten, Stichproben & Kennzahlen
Hier geht es um Datentypen (qualitativ, quantitativ, longitudinal, querschnittlich) und um gute Stichprobenverfahren. Themen wie Bias und erste Bootstrap-Ideen helfen, typische Fallen in der Datenerhebung zu erkennen. Zentrale Kennzahlen wie Mittelwert, Median, Varianz und Standardabweichung werden eingeführt und kritisch interpretiert.
Modul 3 – Verteilungen, Hypothesentests & Regression
Dieses Modul behandelt wichtige Verteilungen wie Normal-, Binomial- und Poisson-Verteilung. Die Teilnehmenden lernen Konfidenzintervalle, p-Werte sowie Typ-I- und Typ-II-Fehler kennen und setzen einfache Hypothesentests ein. Zudem werden Korrelation, einfache lineare Regression und das Verständnis von R² anhand verständlicher Beispiele erarbeitet.
Modul 4 – Praxisprojekt, Ethik & Kommunikation
Im Abschlussmodul arbeiten die Teilnehmenden an einem Mini-Projekt oder Notebook zu einem realen Datensatz. Sie beschreiben und visualisieren Daten, interpretieren Kennzahlen, prüfen eine einfache Hypothese und kommunizieren ihre Ergebnisse adressatengerecht. Ergänzend werden Themen wie Transparenz, Reproduzierbarkeit und ethische Aspekte statistischer Analysen diskutiert.