Datenanalyse mit Excel und Python

Kurs-ID 101
veröffentlicht bis 30.12.2024
Onlinekurs Dieses Angebot findet digital statt.
Zeitaufwand 16 Stunden
Kosten k. A.
Kostendetails auf Anfrage
Voraussetzung Grundkenntnisse Programmieren
Abschluss Zertifikat
Ansprechpartner Frau Dr. Teodora Guenkova-Luy

 

BildungsgutscheinFörderfähig nach Fachkursprogramm des ESF
k. A.k. A.

 

Beschreibung
Inhalte in Kürze

Heute beherrschen Daten die Welt. Dies hat zu einer großen Nachfrage nach Data Scientists geführt. Ein Data Scientist hilft Unternehmen mit datengestützten Entscheidungen ihr Geschäft zu verbessern und lösungsorientiert Produkte und Prozesse zu optimieren. Die Fähigkeiten eines Data Scientists sind in hohem Maße nachgefragt. Der Einstieg in die Data Science Welt gelingt mit Excel und Python – und mit diesem Seminar in folgenden 5 Schritten:
1. Datenqualität - Aufbereitung und Überprüfung der Datensätze, was kann man mit Excel und Notepad++ machen. Daten bearbeiten als Zahlen und Text (Reguläre Ausdrücke und HEX Editor).
2. Filehandling - Überführung der Daten in korrektes Format für die zu benutzenden Tools (Internationalisierung, CSV-Format, Ab-/Aufrundung, Import/Export)
3. Filterung und Diagramme – Schnellanalyse und wichtigste Diagrammtypen in Excel
4. Mathematik und Programmieren – Aufbereitung der Daten für komplexe Analysen mit Programmiertools. Bsp. Python Bibliotheken für Daten, Filehandling, Arrays, Logging und Diagramme und Vergleich mit Excel.
5. Die Maschine Learning Trickkiste – KI-Methoden und das tiefere Verständnis für Ergebnisse. Einführung in die mathematischen Methoden der Daten-Analyse an Python-Code Beispielen.

Wir zeigen in diesem Seminar mit zahlreichen Beispielen aus den Bereichen der medizinischen Statistik, Finanz-Daten, Automotive- und Mobilitäts-Daten usw. unterschiedliche Ausprägungen und Möglichkeiten der Aufbereitung und der Analyse der Daten.

Excel ist das weltweit am häufigsten verwendete Tabellenkalkulationsprogramm und ist auch ein leistungsstarkes Werkzeug für mathematische Funktionen. Excel ist vergleichsweise leicht zu erlernen. Die Einsatzmöglichkeiten sind vielfältig und mit zunehmender Erfahrung können fortgeschrittene Data Science Aufgabenstellungen bearbeitet werden. Excel wird kontinuierlich von Microsoft unterstützt und die Vorlagen und Frameworks sind weit verbreitet und können von Ihnen und anderen wiederverwendet werden.

Wir werden in diesem Seminar den Einstieg in Datenqualität und Excel über die Syntaxvereinbarungen und das Zellen-Handling für Excel machen. Wir können dann die Formatierungsmöglichkeiten und die Datenanalysemöglichkeiten kennenlernen. Dazu gehört auch die Behandlung der wichtigsten eingebauten Funktionen zur Datenanalyse. Mit Beispielen werden wir die Visualisierungsmöglichkeiten veranschaulichen. Mehrere Data Science Fragestellungen werden wir mit den Tools zu Tabellen-Aufbereitung, sowie den mathematischen und statistischen Methoden in Excel umsetzen und bearbeiten.

Excel ist immer noch ein wichtiges Analyse-Tool und hat in den vergangenen Jahren auch weitere Funktionen dazu bekommen. Doch große und unhandliche Arbeitsmappen mit Mengen an Formeln sind für umfangreichere (Routine-)Aufgaben nicht mehr passend. Fortgeschrittene Excel-Nutzer können sich ihre Arbeit durch Python-Tools wesentlich erleichtern.

Python ist eine Programmiersprache, die wie für Data Scientists gemacht ist: Python verfügt über eingebaute Mathematik- und Analyse-Bibliotheken (Numpy, SciPy, Pandas, Matplotlib,) und Funktionen, die die Berechnung mathematischer Probleme und die Datenanalyse erleichtern.

Anhand zahlreicher praktischer Beispiele werden wir in Python einsteigen. Wir werden die Datenvor- und Aufbereitung sowie die wesentlichen Vorarbeiten zur Sicherstellung einer hinreichenden Datenqualität besprechen. Filehandling, Datenformate und Datenbereinigung gehören dazu. Wir werden die grundlegenden graphischen Möglichkeiten kennenlernen. Wichtige mathematische und statistische Funktionen mit Python bilden einen Schwerpunkt und werden für fortschrittliche Methoden der Datenanalyse (Maschinelles Lernen mit Regression, k-Means, Bagging) angewandt.

Die Daten können sowohl als Zahlen, als auch als Text betrachtet werden. Einige Methoden zu Datenqualitätssicherung aus dem Bereich der Text-Analyse, wie Regular Expressions (RegEx) oder HEX-Editor für Zeichentypanalyse werden mit dem Freeware Tool Notepad++ und mit Python gezeigt.

Die Kombination von Freeware wie Notepad++ und Anakonda Python mit weitverbreiteten Tools wie Excel kann für Data Science Aufgaben sehr sinnvoll in Proof-Of-Concept oder Prototyping Bereichen sein, um Entscheidungen und Vorbereitungen für größere Projekt-Aufgaben mit größeren und komplexeren Problemstellungen einzuleiten bzw. Vorkehrungen für die Auswahl komplexerer Tools und Tool-Chains zu treffen.

Ihr Mehrwert

Sie haben in Ihrem beruflichen Leben mit Daten zu tun. Immer wieder stehen Sie vor der Herausforderung, mal "schnell eben" die Informationen aus den Daten zu extrahieren. Dabei stehen geeignete Tools oft nicht zur Verfügung, oder sie sind ohne langdauerndes (und wiederholtes!) Training nicht benutzbar oder zu langwierig und umständlich. Dann werden Sie aus diesem Seminar das Know-How mitnehmen, wie Sie Ihre Fragestellungen der Datenanalyse mit Excel und/oder Python behandeln und beantworten können! Wir werden auch einige weitere einfache Tools, wie Notepad++, oder RegEx, zur Datenbereinigung und -Aufbereitung kennenlernen. Sie werden auch ein "Gefühl" entwickeln können, was in den Daten steckt und welche Analysemöglichkeiten hilfreich sein können. Sie werden in die Welt der Data Scientists einteigen können und sich ein genaueres Bild über diesen boomenden Berufszweig machen können.


Warum Sie dieses Seminar besuchen sollten

Sie haben wenig Zeit. Aber Sie wollen sich die Grundlagen des Data Science Know-Hows so weit aneignen, dass Sie sie nach zwei Tagen anwenden können – mit Excel und Python. Dann sollten Sie diese zwei Tage investieren und dieses Seminar besuchen !

Welche Voraussetzungen Sie mitbringen sollten

Wir werden nicht in die Tiefen der Mathematik einsteigen, aber ein wenig Interesse an Statistik und Mathematik wäre nicht schlecht. Gut wäre ferner, wenn Sie schon einmal Berührung mit Programmiersprachen gehabt hätten und Begriffe wie Variablen, Datentypen, Zahlendarstellungen, Referenzen, Operatoren, Funktionen, logische Bedingungen, Schleifen, Arrays, String-Handling gehört haben.
Sie sollten Basis-Kenntnisse in Excel haben bei Themen, wie Tabellen-Kalkulation mit Excel Funktionen, mathematische Bedeutung der Excel-Basis-Funktionen zum Rechnen, Zellen- und Tabellen-Referenzen und Zellenformatierung.
Basis-Kenntnisse bei der Suche und dem Filtern von Daten (wie RegEx) wären von Vorteil ebenso wie Basis-Kenntnisse zu File-Formaten und Daten-Import/-Export.


Was Sie noch mitbringen sollten
Systemvoraussetzungen:
• Laptop mit Windows 10 oder 11
• Office Umgebung mit lokal aktiviertem Excel Konto auf dem PC, Mindestversion Office 2013 (Home and Student). Beachten Sie, dass die neueste Online Office Umgebung „Office 365“ ohne Vorhandensein von Netzwerkumgebung oder außerhalb des VPNs Ihres Unternehmens (bei Geschäftsrechner) nicht funktionieren könnte.
• Vorinstallierte Anakonda/Spyder Umgebung für Python aus der folgenden Quelle:
https://www.anaconda.com/products/distribution
Bitte möglichst die neueste Version bei der Distribution nehmen.
• Vorinstalliertes Notepad++ aus der folgenden Quelle:
https://notepad-plus-plus.org/downloads/
Bitte möglichst die neueste Version bei der Distribution nehmen.
• Lokale Installationsrechte auf dem Laptop sollen möglichst vorhanden sein, um Notepad++ oder Anakonda Packages bei Bedarf nachzuladen.
• Ihr Laptop soll mit Sicherheitssoftware zum Überprüfen von USB-Sticks ausgestatten sein, falls die Übertragung der Bespiele per USB-Stick erfolgen sollte. Alternativ werden die Übungsaufgaben per E-Mail oder Cloud versendet.

Ihre Referentin

Frau Dr. Guenkova-Luy verfügt über Masterabschlüsse der Elektrotechnik und der Informatik und hat auf dem Gebiet der verteilten Systeme promoviert. Sie war über 10 Jahre als Senior Software Architektin in der Automobil-Industrie tätig und ist seit 2022 mit COREPROG engineering als freie Beraterin und Dozentin verbunden.