Data Analyst
Kurs-ID | 9096-2024-11-11 |
Datum | 11.11.2024 bis 04.04.2025 |
Dauer | 20 Woche(n) |
Unterrichtszeiten | Montag bis Freitag von 08:30 bis 15:35 Uhr (in Wochen mit Feiertagen von 8:30 bis 17:10 Uhr) |
Kosten | k. A. |
Zielgruppe | Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der BWL, Mathematik oder (Wirtschafts-)Informatik und vergleichbarer Qualifikation. |
Abschluss | Zertifikat „Data Analyst“, Zertifikat „Statistik“, Zertifikat „Relationale Datenbanken-SQL“, Zertifikat „Python“, Zertifikat „Data Engineer“, Zertifikat „Data Analytics“ |
Förderung | Bildungsgutschein (Arbeitsuchende und Arbeitslose), Weiterbildungsförderung für Beschäftigte, Europäischer Sozialfonds ESF (Kurzarbeit oder Transfergesellschaften). Weitere Förderstellen: Berufsförderungsdienst (BFD), die Berufsgenossenschaft (BG) sowie der Rentenversicherungsträger (DRV). |
Präsenzkurs | Keine Angabe. |
mind. Teilnehmerzahl | 6 |
max. Teilnehmerzahl | 25 |
URL des Kurses | Details beim Anbieter |
Anmelde URL des Kurses | Direkte Anmeldung beim Anbieter |
spezielles Angebot für Dozenten | Keine Angabe. |
Veranstaltungsort
|
alfatraining Bildungszentrum GmbH
Martinstr. 42-44 73728 Esslingen |
Abendkurs | Bildungsgutschein | Förderfähig nach Fachkursprogramm des ESF | Barierrefreier Zugang |
---|---|---|---|
Nein | Ja | k. A. | k. A. |
Beschreibung |
---|
Data Analysts verfügen über Kenntnisse in der Statistik, in der Nutzung von Datenbanken und beherrschen die Programmiersprache Python. Auch verfügen sie über Fachwissen des Data Engineerings und der Datenanalyse und können dieses mit dem Einsatz von Künstlicher Intelligenz (KI) verbinden. Statistik Statistische Grundlagen (ca. 6 Tage) Messtheoretische Grundlagen (Grundgesamtheit und Stichprobe, Stichprobenarten, Messung und Skalenniveaus) Univariate Deskriptivstatistik (Häufigkeitsverteilungen, Zentralmaße, Streuungsmaße, Standardwert, Histogramme, Balkendiagramme, Kreisdiagramme, Liniendiagramme und Boxplots) Bivariate Deskriptivstatistik (Zusammenhangsmaße, Korrelationskoeffizienten, Kreuztabellen, Streudiagramme und gruppierte Balkendiagramme) Grundlagen der induktiven Inferenzstatistik (Wahrscheinlichkeitsverteilung, Normalverteilung, Mittelwerteverteilung, Signifikanztest, Nullhypothesentest nach Fisher, Effektgröße, Parameterschätzung, Konfidenzintervalle, Fehlerbalkendiagramme, Poweranalysen und Ermittlung des optimalen Stichprobenumfangs) Künstliche Intelligenz (KI) im Arbeitsprozess Vorstellung von konkreten KI-Technologien im beruflichen Umfeld Anwendungsmöglichkeiten und Praxis-Übungen Methoden zum Vergleich von zwei Gruppen (ca. 5 Tage) z- und t-Test für eine Stichprobe (Abweichung von einem vorgegebenen Wert) t-Test für den Mittelwertsunterschied von zwei unabhängigen/verbundenen Stichproben Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit zwei Gruppen) Unterstützende Signifikanztests (Anderson-Darling-Test, Ryan-Joiner-Test, Levene-Test, Bonnet-Test, Signifikanztest für Korrelationen) Nonparametrische Verfahren (Wilcoxon-Test, Vorzeichentest, Mann-Whitney-Test) Kontingenzanalysen (Binomialtest, Exakter Test nach Fisher, Chi-Quadrat-Test, Kreuztabellen mit Assoziationsmaße) Methoden zum Mittelwertvergleich von mehreren Gruppen (ca. 5 Tage) Ein- und zweifaktorielle Varianzanalyse (einfache und balancierte ANOVA) Mehrfaktorielle Varianzanalyse (Allgemeines lineares Modell) Feste, zufällige, gekreuzte und geschachtelte Faktoren Mehrfachvergleichsverfahren (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell) Interaktionsanalyse (Analyse von Wechselwirkungseffekten) Trennschärfe und Poweranalyse bei Varianzanalysen Einführung in die Versuchsplanung (DoE, Design of Experiments) (ca. 1 Tag) Voll- und teilfaktorielle Versuchspläne Projektarbeit (ca. 3 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Relationale Datenbanken mit SQL Grundlagen von Datenbanksystemen mit Access (ca. 3 Tage) Redundante Daten Datenintegrität Normalisierung BCNF DB-Entwurf Beziehung 1:n, m:n Datentypen Tabellen Primär- und Fremdschlüssel Referentielle Integrität Beziehungen zwischen Relationen Entity-Relationship-Modell Index, Standartwert Einschränkungen (Check) Abfragen Formulare, Berichte Zirkelbezug Einführung in SQL Server Management Studio (SSMS) (ca. 2 Tage) Übersicht Phys. DB-Design Tabellen erstellen Datentypen in MS SQL Primary Key Einschränkungen, Standartwerte, Diagramm, Beziehungen Backup und Restore Künstliche Intelligenz (KI) im Arbeitsprozess Vorstellung von konkreten KI-Technologien im beruflichen Umfeld Anwendungsmöglichkeiten und Praxis-Übungen Einführung in DDL (ca. 8 Tage) SQL Grundlagen Syntax Befehle Mehrere Tabellen Operatoren Ablaufkontrolle Skalarwertfunktionen Tabellenwertfunktionen Systemfunktionen Prozeduren mit und ohne Parameter Fehlertypen Transaktionen, Sperren, DeadLock DCL – Data Control Language (ca. 1 Tag) Anmeldungen Benutzer:innen Rollen Berechtigungen Datentypen, Datenimport und -export (ca. 1 Tag) Datentyp geography Datenexport, Datenimport Projektarbeit (ca. 5 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Programmierung mit Python Grundlagen Python (ca. 1 Tag) Geschichte, Konzepte Verwendung und Einsatzgebiete Syntax Erste Schritte mit Python (ca. 5 Tage) Zahlen Zeichenketten Datum und Zeit Standardeingabe und -ausgabe list, tuple dict, set Verzweigungen und Schleifen (if, for, while) Künstliche Intelligenz (KI) im Arbeitsprozess Vorstellung von konkreten KI-Technologien im beruflichen Umfeld Anwendungsmöglichkeiten und Praxis-Übungen Funktionen (ca. 5 Tage) Eigene Funktionen definieren Variablen Parameter, Rekursion Funktionale Programmierung Fehlerbehebung (ca. 0,5 Tage) try, except Programmunterbrechungen abfangen Objektorientierte Programmierung (ca. 4,5 Tage) Python-Klassen Methoden Unveränderliche Objekte Datenklasse Vererbung Grafische Benutzeroberfläche (ca. 1 Tag) Buttons und Textfelder grid-Layout Dateiauswahl Projektarbeit (ca. 3 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Data Engineer Grundlagen Business Intelligence (ca. 2 Tage) Anwendungsfelder, Dimensionen einer BI Architektur Grundlagen Business Intelligence, OLAP, OLTP, Aufgaben der Data Engineers Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten Anforderungsmanagement (ca. 2 Tage) Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse Datenmodellierung, Einführung/Modellierung mit ERM Einführung/Modellierung in der UML · Klassendiagramme · Use-Case Analyse · Aktivitätsdiagramme Künstliche Intelligenz (KI) im Arbeitsprozess Vorstellung von konkreten KI-Technologien im beruflichen Umfeld Anwendungsmöglichkeiten und Praxis-Übungen Datenbanken (ca. 3 Tage) Grundlagen von Datenbanksystemen Architektur von Datenbankmanagementsystemen Anwendung RDBMS Umsetzung Datenmodell in RDBMS, Normalformen Praktische und theoretische Einführung in SQL Grenzen von Relationalen Datenbanken, csv, json Data Warehouse (ca. 4 Tage) Star Schema Datenmodellierung Erstellung Star Schema in RDBMS Snowflake Schema, Grundlagen, Datenmodellierung Erstellung Snowflake Schema in RDBMS Galaxy Schema: Grundlagen, Datenmodellierung Slowly Changing Dimension Tables Typ 1 bis 5 – Restating, Stacking, Reorganizing, mini Dimension und Typ 5 Einführung in normal, causal, mini und monster, heterogeneous und sub Dimensions Vergleich von state und transaction oriented Faktentabellen, Density und Storage vom DWH ETL (ca. 4 Tage) Data Cleansing · Null Values · Aufbereitung von Daten · Harmonisierung von Daten · Anwendung von Regular Expressions Data Understanding · Datenvalidierung · Statistische Datenanalyse Datenschutz, Datensicherheit Praktischer Aufbau von ETL-Strecken Data Vault 2.0, Grundlagen, Hubs, Links, Satellites, Hash Key, Hash Diff. Data Vault Datenmodellierung Praktischer Aufbau eines Data Vault Modells – Raw Vault, Praktische Umsetzung von Hash-Verfahren Projektarbeit (ca. 5 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Data Analytics Einführung Datenanalyse (ca. 1 Tag) CRISP-DM Referenzmodell Data Analytics Workflows Begriffsabgrenzung Künstliche Intelligenz, Machine Learning, Deep Learning Anforderungen und Rolle im Unternehmen der Data Engineers, Data Scientists und Data Analysts Wiederholung Grundlagen Python (ca. 1 Tag) Datentypen Funktionen Datenanalyse (ca. 3 Tage) Zentrale Python-Module im Kontext Data Analytics (NumPy, Pandas) Prozess der Datenaufbereitung Data Mining Algorithmen in Python Künstliche Intelligenz (KI) im Arbeitsprozess Vorstellung von konkreten KI-Technologien im beruflichen Umfeld Anwendungsmöglichkeiten und Praxis-Übungen Datenvisualisierung (ca. 3 Tage) Explorative Datenanalyse Insights Datenqualität Nutzenanalyse Visualisierung mit Python: Matplotlib, Seaborn, Plotly Express Data Storytelling Datenmanagement (ca. 2 Tage) Big Data Architekturen Relationale Datenbanken mit SQL Vergleich von SQL- und NoSQL-Datenbanken Business Intelligence Datenschutz im Kontext der Datenanalyse Datenanalyse im Big Data Kontext (ca. 1 Tag) MapReduce-Ansatz Spark NoSQL Dashboards (ca. 3 Tage) Bibliothek: Dash Aufbau von Dashboards – Dash Components Customizing von Dashboards Callbacks Text Mining (ca. 1 Tag) Data Preprocessing Visualisierung Bibliothek: SpaCy Projektarbeit (ca. 5 Tage) Zur Vertiefung der gelernten Inhalte Präsentation der Projektergebnisse Änderungen möglich. Die Lehrgangsinhalte werden regelmäßig aktualisiert. |
Schlagworte |
---|
datenbank, programmierung, objektorientiert, sql |
Gelistet in folgenden Rubriken: |
---|