Big Data Engineer

Kurs-ID 7666-0088-20230227
Datum 27.02.2023 bis 21.04.2023
Dauer 8 Wochen
Unterrichtszeiten Montag bis Freitag von 08:30 bis 15:35 Uhr (in Wochen mit Feiertagen von 8:30 bis 17:10 Uhr)
Kosten k. A.
Zielgruppe <p>Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der Informatik, Wirtschaftsinformatik, BWL, Mathematik oder vergleichbarer Qualifikation.</p>
Voraussetzung Programmierkenntnisse (idealerweise Python) und Erfahrungen mit Datenbanken (SQL) werden vorausgesetzt.
Abschluss Zertifikat/Teilnahmebestätigung
Förderung Arbeitsagentur, Jobcenter, Beschäftigungs- und Qualifizierungsgesellschaften, BFD, DRV
Präsenzkurs Keine Angabe.
mind. Teilnehmerzahl 6
max. Teilnehmerzahl 25
URL des Kurses Details beim Anbieter
Anmelde URL des Kurses Direkte Anmeldung beim Anbieter
spezielles Angebot für Dozenten Nein.
Veranstaltungsort
 
alfatraining Bildungszentrum GmbH
Georgstrasse 15
88212 Ravensburg

 

AbendkursBildungsgutscheinBarierrefreier Zugang
NeinJaNein

 

Beschreibung
Big Data Engineer:

Data Engineer
Grundlagen Business Intelligence (ca. 2 Tage)
Aufgaben eines Data Engineers
Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten
OLAP
OLTP

Anforderung von Daten (ca. 2 Tage)
Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse
Einführung/Modellierung in der UML
- Use-Case Analyse
- Klassendiagramme
- Aktivitätsdiagramme
- Modellierung mit ERM

Datenbanken (ca. 2 Tage)
Grundlagen von Datenbanksystemen
Einführung/Modellierung in der UML
Architektur von Datenbankmanagementsystemen
Praktische und theoretische Einführung in SQL
Verwendung von Datenbanken (SQLite, PostgreSQL)
Grenzen von Relationalen Datenbanken

Data Warehouse Modellierung (ca. 4 Tage)
Star Schema
Snowflake Schema
Galaxy Schema
Data Vault 2.0
- Hubs
- Satellites
- Links im Raw- und Business Vault
- Hash Key
- Hash Diff
Slowly Changing Dimension Tables Typ 1 bis 5 (Restating, Stacking, Reorganizing, Mini Dimension und Typ 5
Einführung in normal, causal, mini und monster, heterogeneous und subdimensions
Vergleich von state und transaction oriented Faktentabellen
Density und Storage vom DWH

ETL (ca. 5 Tage)
Data Cleansing
- Null Values
- Aufbereitung von Daten
- Harmonisierung von Daten
- Anwendung von Regular Expressions
Datensicherheit/Datenschutz
Data Understanding
- Datenvalidierung
- Statistische Datenanalyse
Praktischer Aufbau von ETL-Strecken
Praktischer Aufbau eines Data Vault Modells - Business und Raw Vault
Praktische Umsetzung von Hash-Verfahren
json
csv

Projektarbeit (ca. 5 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse


Big Data Specialist mit Hadoop
Was ist Big Data? (ca. 1 Tag)
Volume, Velocity, Variety, Value, Veracity
Chancen und Risiken großer Datenmengen
Abgrenzung: Business Intelligence, Data Analytics, Data Science
Was ist Data Mining?

Einführung in Hadoop (ca. 2 Tage)
Grundlagen Hadoop
HDFS – das Hadoop Distributed File System
Big-Data-Lösungen in der Cloud
Datenzugriffsmuster für HDFS
Daten-Speicherung in einem HDFS-Cluster

MapReduce (ca. 3 Tage)
Map Reduce Philosophie
Hadoop Cluster
Verketten von Map Reduce Jobs

Hadoop-Komponenten (ca. 3 Tage)
Kurzvorstellung anderer Tools wie beispielsweise Pig und Hive
Datenübertragung nach Hadoop
YARN-Anwendungen
Hadoop JAVA-API
Apache Spark

NoSQL und HBase (ca. 3 Tage)
CAP-Theorem
ACID und BASE
Typen von Datenbanken
HBase

Big Data Visualisierung (ca. 3 Tage)
Theorien der Visualisierung
Diagrammauswahl
Neue Diagrammarten
Werkzeuge zur Datenvisualisierung

Projektarbeit (ca. 5 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse

 

Gelistet in folgenden Rubriken: