Big Data Engineer
Kurs-ID | 7666-0057-20230227 |
Datum | 27.02.2023 bis 21.04.2023 |
Dauer | 8 Wochen |
Unterrichtszeiten | Montag bis Freitag von 08:30 bis 15:35 Uhr (in Wochen mit Feiertagen von 8:30 bis 17:10 Uhr) |
Kosten | k. A. |
Zielgruppe | <p>Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der Informatik, Wirtschaftsinformatik, BWL, Mathematik oder vergleichbarer Qualifikation.</p> |
Voraussetzung | Programmierkenntnisse (idealerweise Python) und Erfahrungen mit Datenbanken (SQL) werden vorausgesetzt. |
Abschluss | Zertifikat/Teilnahmebestätigung |
Förderung | Arbeitsagentur, Jobcenter, Beschäftigungs- und Qualifizierungsgesellschaften, BFD, DRV |
Präsenzkurs | Keine Angabe. |
mind. Teilnehmerzahl | 6 |
max. Teilnehmerzahl | 25 |
URL des Kurses | Details beim Anbieter |
Anmelde URL des Kurses | Direkte Anmeldung beim Anbieter |
spezielles Angebot für Dozenten | Nein. |
Veranstaltungsort
|
alfatraining Bildungszentrum GmbH
Schillerstraße 1/1 89077 Ulm |
Abendkurs | Bildungsgutschein | Barierrefreier Zugang |
---|---|---|
Nein | Ja | Nein |
Beschreibung |
---|
Big Data Engineer: Data Engineer Grundlagen Business Intelligence (ca. 2 Tage) Aufgaben eines Data Engineers Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten OLAP OLTP Anforderung von Daten (ca. 2 Tage) Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse Einführung/Modellierung in der UML - Use-Case Analyse - Klassendiagramme - Aktivitätsdiagramme - Modellierung mit ERM Datenbanken (ca. 2 Tage) Grundlagen von Datenbanksystemen Einführung/Modellierung in der UML Architektur von Datenbankmanagementsystemen Praktische und theoretische Einführung in SQL Verwendung von Datenbanken (SQLite, PostgreSQL) Grenzen von Relationalen Datenbanken Data Warehouse Modellierung (ca. 4 Tage) Star Schema Snowflake Schema Galaxy Schema Data Vault 2.0 - Hubs - Satellites - Links im Raw- und Business Vault - Hash Key - Hash Diff Slowly Changing Dimension Tables Typ 1 bis 5 (Restating, Stacking, Reorganizing, Mini Dimension und Typ 5 Einführung in normal, causal, mini und monster, heterogeneous und subdimensions Vergleich von state und transaction oriented Faktentabellen Density und Storage vom DWH ETL (ca. 5 Tage) Data Cleansing - Null Values - Aufbereitung von Daten - Harmonisierung von Daten - Anwendung von Regular Expressions Datensicherheit/Datenschutz Data Understanding - Datenvalidierung - Statistische Datenanalyse Praktischer Aufbau von ETL-Strecken Praktischer Aufbau eines Data Vault Modells - Business und Raw Vault Praktische Umsetzung von Hash-Verfahren json csv Projektarbeit (ca. 5 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Big Data Specialist mit Hadoop Was ist Big Data? (ca. 1 Tag) Volume, Velocity, Variety, Value, Veracity Chancen und Risiken großer Datenmengen Abgrenzung: Business Intelligence, Data Analytics, Data Science Was ist Data Mining? Einführung in Hadoop (ca. 2 Tage) Grundlagen Hadoop HDFS – das Hadoop Distributed File System Big-Data-Lösungen in der Cloud Datenzugriffsmuster für HDFS Daten-Speicherung in einem HDFS-Cluster MapReduce (ca. 3 Tage) Map Reduce Philosophie Hadoop Cluster Verketten von Map Reduce Jobs Hadoop-Komponenten (ca. 3 Tage) Kurzvorstellung anderer Tools wie beispielsweise Pig und Hive Datenübertragung nach Hadoop YARN-Anwendungen Hadoop JAVA-API Apache Spark NoSQL und HBase (ca. 3 Tage) CAP-Theorem ACID und BASE Typen von Datenbanken HBase Big Data Visualisierung (ca. 3 Tage) Theorien der Visualisierung Diagrammauswahl Neue Diagrammarten Werkzeuge zur Datenvisualisierung Projektarbeit (ca. 5 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse |
Gelistet in folgenden Rubriken: |
---|