Data Analyst

Kurs-ID 7677-0009-20230102
Datum 02.01.2023 bis 19.05.2023
Dauer 20 Wochen
Unterrichtszeiten Montag bis Freitag von 08:30 bis 15:35 Uhr (in Wochen mit Feiertagen von 8:30 bis 17:10 Uhr)
Kosten k. A.
Zielgruppe <p>Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der BWL, Mathematik oder (Wirtschafts-) Informatik, vergleichbarer Qualifikation.</p>
Abschluss Zertifikat/Teilnahmebestätigung
Förderung Arbeitsagentur, Jobcenter, Beschäftigungs- und Qualifizierungsgesellschaften, BFD, DRV
Präsenzkurs Keine Angabe.
mind. Teilnehmerzahl 6
max. Teilnehmerzahl 25
URL des Kurses Details beim Anbieter
Anmelde URL des Kurses Direkte Anmeldung beim Anbieter
spezielles Angebot für Dozenten Nein.
Veranstaltungsort
 
alfatraining Bildungszentrum GmbH
Bismarckalle 13
79098 Freiburg

 

AbendkursBildungsgutscheinBarierrefreier Zugang
NeinJaJa

 

Beschreibung
Data Analyst:

Statistik
Statistische Grundlagen (ca. 6 Tage)
Messtheoretische Grundlagen (Grundgesamtheit und Stichprobe, Stichprobenarten, Messung und Skalenniveaus)
Univariate Deskriptivstatistik (Häufigkeitsverteilungen, Zentralmaße, Streuungsmaße, Standardwerte, Histogramme, Balkendiagramme, Kreisdiagramme, Liniendiagramme und Boxplots)
Bivariate Deskriptivstatistik (Zusammenhangsmaße, Korrelationskoeffizienten, Kreuztabellen, Streudiagramme und gruppierte Balkendiagramme)
Grundlagen der induktiven Inferenzstatistik (Wahrscheinlichkeitsverteilung, Normalverteilung, Mittelwerteverteilung, Signifikanztest, Nullhypothesentest nach Fisher, Signifikanz, Effektgröße, Parameterschätzung, Konfidenzintervalle, Fehlerbalkendiagramme, Poweranalysen und Ermittlung des optimalen Stichprobenumfangs)

Methoden zum Vergleich von zwei Gruppen (ca. 5 Tage)
z- und t-Test für eine Stichprobe (Abweichung von einem vorgegebenen Wert)
t-Test für den Mittelwertsunterschied von zwei unabhängigen/ verbundenen Stichproben
Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit zwei Gruppen)
Unterstützende Signifikanztests (Anderson-Darling-Test, Ryan-Joiner-Test, Levene-Test, Bonnet-Test, Signifikanztest für Korrelationen)
Nonparametrische Verfahren (Wilcoxon-Test, Vorzeichentest, Mann-Whitney-Test
Kontingenzanalysen (Binomialtest, Exakter Test nach Fisher, Chi-Quadrat-Test, Kreuztabellen mit Assoziationsmaße)

Methoden zum Mittelwertvergleich von mehreren Gruppen (ca. 5 Tage)
Ein- und zweifaktorielle Varianzanalyse (einfache und balancierte ANOVA)
Mehrfaktorielle Varianzanalyse (Allgemeines Lineares Modell)
Feste, zufällige, gekreuzte und geschachtelte Faktoren
Mehrfachvergleichsverfahren (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell)
Interaktionsanalyse (Analyse von Wechselwirkungseffekten)
Trennschärfe und Poweranalyse bei Varianzanalysen

Einführung in die Versuchsplanung (DoE, Design of Experiments) (ca. 1 Tag)
Voll- und teilfaktorielle Versuchspläne

Projektarbeit (ca. 3 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse


SQL - Relationale Datenbanken
Grundlagen von Datenbanksystemen mit Access (ca. 3 Tage)
Redundante Daten
Datenintegrität
Normalisierung
BCNF
DB-Entwurf
Beziehung 1:n, m:n
Datentypen
Tabellen
Primär- und Fremdschlüssel
Referentielle Integrität
Beziehungen zwischen Relationen
Entity-Relationship-Modell
Index, Standartwert
Einschränkungen (Check)
Abfragen
Formulare, Berichte
Zirkelbezug

Einführung in SQL Server Management Studio (SSMS) (ca. 2 Tage)
Übersicht
Phys. DB-Design
Tabellen erstellen
Datentypen in MS SQL
Primary Key
Einschränkungen, Standartwerte, Diagramm, Beziehungen
Backup und Restore

Einführung in DDL (ca. 8 Tage)
SQL Grundlagen
Syntax
Befehle
Mehrere Tabellen
Operatoren
Ablaufkontrolle
Skalarwertfunktionen
Tabellenwertfunktionen
Systemfunktionen
Prozeduren mit und ohne Parameter
Fehlertypen
Transaktionen, Sperren, DeadLock

DCL – Data Control Language (ca. 1 Tag)
Anmeldungen
Benutzer
Rollen
Berechtigungen

Datentypen, Datenimport und -export (ca. 1 Tag)
Datentyp geography
Datenexport, Datenimport

Projektarbeit (ca. 5 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse


Programmierung mit Python
Grundlagen Python (ca. 1 Tag)
Geschichte, Konzepte
Verwendung und Einsatzgebiete
Syntax

Erste Schritte mit Python (ca. 5 Tage)
Zahlen
Zeichenketten
Datum und Zeit
Standardeingabe und -ausgabe
list, tuple dict, set
Verzweigungen und Schleifen (if, for, while)

Funktionen (ca. 5 Tage)
Eigene Funktionen definieren
Variablen
Parameter, Rekursion
Funktionale Programmierung

Fehlerbehebung (ca. 0,5 Tage)
try, except
Programmunterbrechungen abfangen

Objektorientierte Programmierung (ca. 4,5 Tage)
Python-Klassen
Methoden
Unveränderliche Objekte
Datenklasse
Vererbung

Grafische Benutzeroberfläche (ca. 1 Tag)
Buttons und Textfelder
grid-Layout
Dateiauswahl

Projektarbeit (ca. 3 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse


Data Engineer
Grundlagen Business Intelligence (ca. 2 Tage)
Aufgaben eines Data Engineers
Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten
OLAP
OLTP

Anforderung von Daten (ca. 2 Tage)
Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse
Einführung/Modellierung in der UML
- Use-Case Analyse
- Klassendiagramme
- Aktivitätsdiagramme
- Modellierung mit ERM

Datenbanken (ca. 2 Tage)
Grundlagen von Datenbanksystemen
Einführung/Modellierung in der UML
Architektur von Datenbankmanagementsystemen
Praktische und theoretische Einführung in SQL
Verwendung von Datenbanken (SQLite, PostgreSQL)
Grenzen von Relationalen Datenbanken

Data Warehouse Modellierung (ca. 4 Tage)
Star Schema
Snowflake Schema
Galaxy Schema
Data Vault 2.0
- Hubs
- Satellites
- Links im Raw- und Business Vault
- Hash Key
- Hash Diff
Slowly Changing Dimension Tables Typ 1 bis 5 (Restating, Stacking, Reorganizing, Mini Dimension und Typ 5
Einführung in normal, causal, mini und monster, heterogeneous und subdimensions
Vergleich von state und transaction oriented Faktentabellen
Density und Storage vom DWH

ETL (ca. 5 Tage)
Data Cleansing
- Null Values
- Aufbereitung von Daten
- Harmonisierung von Daten
- Anwendung von Regular Expressions
Datensicherheit/Datenschutz
Data Understanding
- Datenvalidierung
- Statistische Datenanalyse
Praktischer Aufbau von ETL-Strecken
Praktischer Aufbau eines Data Vault Modells - Business und Raw Vault
Praktische Umsetzung von Hash-Verfahren
json
csv

Projektarbeit (ca. 5 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse


Data Analytics
Einführung Datenanalyse (ca. 1 Tag)
CRISP-DM Referenzmodell
Data Analytics Workflows
Begriffsabgrenzung Künstliche Intelligenz, Machine Learning, Deep Learning
Anforderungen und Rolle im Unternehmen des Data Engineers, Data Scientists und Data Analysts

Wiederholung Grundlagen Python (ca. 1 Tag)
Datentypen
Funktionen

Datenanalyse (ca. 3 Tage)
Zentrale Python-Module im Kontext Data Analytics (NumPy, Pandas)
Prozess der Datenaufbereitung
Data Mining Algorithmen in Python

Datenvisualisierung (ca. 3 Tage)
Explorative Datenanalyse
Insights
Datenqualität
Nutzenanalyse
Visualisierung mit Python: Matplotlib, Seaborn, Plotly Express

Datenmanagement (ca. 2 Tage)
Big Data Architekturen
Relationale Datenbanken mit SQL
Vergleich von SQL- und NoSQL-Datenbanken
Business Intelligence
Datenschutz im Kontext der Datenanalyse

Datenanalyse im Big Data Kontext (ca. 1 Tag)
MapReduce-Ansatz
Spark
NoSQL

Dashboards (ca. 3 Tage)
Bibliothek: Dash
Aufbau von Dashboards – Dash Components
Customizing von Dashboards
Callbacks

TextMining (ca. 1 Tag)
Data Preprocessing
Visualisierung
Bibliothek: SpaCy

Projektarbeit (ca. 5 Tage)
Zur Vertiefung der gelernten Inhalte
Präsentation der Projektergebnisse

 

Gelistet in folgenden Rubriken: