Modulübersicht
Modul 1 - Data Science / Data Engineering Anwendungsfälle und Vorgehensmodelle
Im ersten Modul werden wir uns auf die verschiedenen Anwendungsbereiche konzentrieren, in denen Daten eine relevante Rolle spielen und besprechen, welche Anforderungen an die Wertgenerierung aus Daten gestellt werden. Wir werden alle Rollen besprechen, die in einem datenbasierten Projekt relevant sind und wie interdisziplinäre Teams effizient zusammenarbeiten können.
Anschliessend werden wir uns mit der Art und Weise befassen, wie datenbasierte Projekte strukturiert sind und alle Phasen und deren erfolgreiche Durchführung untersuchen. Wir werden typische Herausforderungen besprechen und Ansätze kennenlernen, die einen erfolgreichen Abschluss eines Data Science Projektes garantieren.
Modul 2 - Kommunikation, Stakeholder Management und Compliance
Im Modul 2 werden wir uns damit befassen, wie man mit Stakeholdern und Managern auf verschiedenen Ebenen zusammenarbeitet. Wir erlernen Methoden zur Kommunikation von datenspezifischen Themen mit verschiedenen Managementebenen, um sie von einer Finanzierung oder einem Projekt zu überzeugen.
Darüber hinaus befassen wir uns mit den rechtlichen Aspekten, die für das Management von Data-Science-Projekten relevant sind, und wie man mit Daten arbeitet, ohne dass rechtliche und datenschutzrechtliche Probleme entstehen. Schliesslich werden wir uns damit befassen, wie man herausfindet, wo in der Geschäftsprozesslandschaft eines Unternehmens die Datenwissenschaft den größten Wert schaffen kann (Grundsätze des Data Governance).
Modul 3 - Data Engineering
In diesem Modul beginnen wir unsere Reise mit dem Studium von Python.
Wir werden uns mit den grundlegenden Konzepten und Techniken des Data Engineering befassen, d. h. mit der Frage, wie man Daten aus verschiedenen Systemen gewinnt. Wir werden uns ansehen, wie man Daten aus verschiedenen Quellen extrahiert (tabellarische Daten, unstrukturierte Daten wie Bilder, Ton- oder Protokolldateien usw.) und wie man sie analysiert und versteht. Abschliessend werden wir uns mit den grundlegenden Konzepten von Datenbanken und mit SQL (Sprache zur Abfrage strukturierter, in einer Datenbank gespeicherter Daten) befassen.
Modul 4 – Data Science Models and Cloud Tools
Wir werden uns auf das Laden und Visualisieren von Daten (Python-Bibliotheken pandas und matplotlib ) konzentrieren. Danach werden wir uns mit den am häufigsten verwendeten Bibliotheken für maschinelles Lernen (wie z.B. scikit-learn) beschäftigen.
In diesem Modul erlernen wir die am häufigsten verwendeten Algorithmen des maschinellen Lernens für Vorhersagen. Wir werden uns mit Supervised (wie lineare Regression) und Unsupervised Learning (wie Clustering oder Anomaly Detection) beschäftigen und dabei viele praktische Übungen bearbeiten.
Die Grundlagen von Cloud-Technologien wie Kubernetes und Virtualisierung werden unterrichtet. Insbesondere werden wir Sie mit MS Azure, Google Cloud und Amazon Web Services vertraut machen. Abschliessend werden wir uns ansehen, wie man solche Lösungen in einer bestehenden Softwarelandschaft einsetzen kann. Zur Abrundung des Moduls wenden wir uns konkreten Anwendungsfällen aus der Unternehmenspraxis zu.
Transferarbeit
Die Transferarbeit besteht aus einem Projekt, das von den Teilnehmenden an einem realen Datensatz durchgeführt wird. Gearbeitet wird in der Regel in 2er Teams.
Der Prozess besteht aus den folgenden Schritten:
Die Teilnehmenden schlagen ein Projekt/Problem aus ihrem Unternehmen oder aus eigenem Interesse vor
Der Vorschlag wird mit den Dozierenden besprochen und von ihnen genehmigt oder Änderungen werden vorgeschlagen
Die Teilnehmenden haben während des CAS Zeit, unter Anleitung der Dozierenden an ihrem Projekt zu arbeiten
Die Projekte werden am letzten Tag des CAS präsentiert
Ziel ist es, dass die Teilnehmerinnen und Teilnehmer Erfahrungen mit einem realen Problem sammeln, das einen Mehrwert für ihren Lebenslauf oder für ihr Unternehmen darstellt.
Schliessen