Gemeinsam werden zentrale Konzepte zu Big Data, Machine Learning und künstlicher Intelligenz erarbeitet und erste Ideen für eigene Projekte generiert. Der Kurs bietet eine systematische, kreative und spannende Bearbeitung des Themas und stützt sich auf unsere Erfahrungen in der Prototypisierung und Umsetzung von Big-Data-Projekten.
Der Kurs besteht aus 3 Modulen.
MODUL 1: BIG DATA EINFÜHRUNG
- Big Data Grundlagen: Definitionen, Trends
- Daten, Informationen, Wissen: Datentypen, Datenherkunft, Dark Data
- Data-Driven Business Geschäftsmodelle, Use Cases, Success Stories
- Rechtliche Aspekte: Data Ownership, Datenschutz, Urheberrecht, Vertragsgestaltung, Geschäftsgeheimnisse
Takeaway: Grundwissen zur Thematik und zu aktuell auftretenden Geschäftsmodellinnovationen. Teilnehmerinnen und Teilnehmer sind folgend in der Lage, im eigenen Unternehmen datengetriebene Innovationsprojekte zu initiieren.
MODUL 2: DATA SCIENCE
- Grundlagen Statistik: Begriffe, Definitionen, Grundkonzepte
- Datenerfassung: Batch vs. Stream, Micro-Batching, CAP
- Datenvorverarbeitung und -integration: ETL, Messaging Queues, Outliers, Missing Values
- Datenanalyse: Machine Learning: Supervised & Unsupervised, Regression, Classification, Clustering, Bias
- Datenvisualisierung: Möglichkeiten und Varianten
Takeaway: Übersicht im Bereich Data Science und Kenntnis über relevante Methoden. Teilnehmerinnen und Teilnehmer sind in der Lage im Einzelfall zu entscheiden, welche Praktiken für Use Cases relevant und zur Lösung des Problems bzw. Erfüllung der Anforderung geeignet sind.
MODUL 3: BIG DATA TECHNOLOGIES
- Grundlagen Technologien: Data Management Platform Lifecycle
- Apache Hadoop Ökosystem: Hadoop & Ökosystem, HDFS, MapReduce, YARN
- Apache Spark: Framework, Architecture, Libraries
- NoSQL: Konzepte, Column, Key-Value, Document, Graph
- Tools und Suites: Open Source vs. Commercial, Enterprise Ready Tools, Cloud vs. On Premise
Takeaway: Kenntnis des aktuellen Technologie-Ökosystems. Fähigkeit zur Selektion von geeigneten Technologien und Tools zur Lösung der Problemstellung bzw. bestmöglichen Erfüllung der Anforderungen.
Zielgruppen
CIO´s, Manager:innen, IT-Mitarbeiter:innen, Teamleiter:innen, Projektleiter:innen, Process Owner, Innovationsmanager:innen, Bereichs- und Abteilungsleiter:innen