Eine der zentralen Herausforderungen im Kontext von „Big Data“ ist die Aufbereitung vorhandener Daten. Zwar stehen vielen Unternehmen Software-Tools zur Datenanalyse zur Verfügung, diese können jedoch nur nutzenbringend eingesetzt werden, wenn die Datenbasis eine ausreichende Qualität hat. In den meisten Fällen sind erhobene Daten jedoch unvollständig. Dies führt dazu, dass die Ergebnisse klassischer Datenanalyseverfahren eine geringe Aussagekraft haben.

Dieses Modul stellt Methoden, Strategien und Technologien vor, die speziell zur Erkennung und zum Ausnutzen von Mustern in großen Datenbeständen verwendet werden können. Um praxisnah vorzugehen, wird die Anwendung der beschriebenen Techniken in der Programmiersprache Python dargestellt.

Ihr Nutzen

Nach der Teilnahme an dem Modul sind Sie in der Lage,

  • Auffälligkeiten in Daten zu bereinigen und/oder auszunutzen
  • Grundlagen der Python-Programmierung anzuwenden
  • systematisch Ansatzpunkte für die Verbesserung des unternehmensinternen Informationsmanagements aufzudecken
  • einfache Bereinigungslogiken zu entwickeln
  • Bedarfe in der Datenbeschaffung und -bereinigung dem jeweils zuständigen „Data Owner“ gezielt und verständlich darzustellen
  • die Basis für unternehmenseigene Datenanalyse-Applikationen zu implementieren.

Inhalte

  • Datentypen und -speicherkonzepte in Python
  • Datenqualität: Vollständigkeit, Frequenz, Plausibilität
  • Grundlagen der Python-Programmierung: Schleifen und if-Bedingungen, Numpy, Pandas, Sklearn
  • Grundlagen der visuellen Datenanalyse mit Matplotlib
  • Ein- und mehrdimensionale numerische Ausreißer-Analyse (mit Python): IQR vs. Z-Score
  • Verteilungsanalyse und Mechanismen der Ausreißer-Erkennung mittels Klassifikatoren (mehrdimensionale Verteilungsanalyse)
  • Algorithmen zur Mustererkennung (mit Python): Lineare Regression, Diskriminanzanalyse, Raum-Distanz-Maße (Support Vector Machine), häufigkeitsbasierte Modelle (Kerndichten)

Zielgruppe

Fach- und Führungskräfte sämtlicher Branchen, die sich mit der Strukturierung und Harmonisierung von unterschiedlichsten Datenquellen beschäftigen, um durch das Heben bislang unerschlossener Informationen einen wirtschaftlichen Mehrwert zu erzielen.

Online-Kurs

Kombination aus selbstständigem E-Learning und Live-Online-Seminaren

Anmeldeschluss:
16.02.2025

Termine

  • Kurs 2025

    Jetzt anmelden

Preis

1.490,00 €

Ort

Graduate & Professional School – ONLINE

Kontakt

Auf dem Bild ist Marlene Schwegmann zu sehen. Sie trägt schulterlanges braunes Haar und einen schwarzen Pullover.

Marlene Schwegmann
Leitung Zertifikatsprogramme
+49 421 5905 4798
E-Mail

Lehrende

Prof. Dr. Armin Varmaz
Betriebswirtschaftslehre, insb. internationales Finanzmanagement, Hochschule Bremen

Fakten

Teilnahmevoraussetzungen • Abschluss eines Studiums oder einer Berufsausbildung
• Mind. einjährige Berufserfahrung
• Fortgeschrittene Excel-Kenntnisse (z.B. MITTELWERT, STABW)
• Zahlenaffinität und Interesse an statistischen Fragestellungen
Maximale Teilnehmendenzahl 15
Art • Modulstudium, einzeln buchbar
• gleichzeitig Modul 2 des CAS-Zertifikatsstudiums "Data Analyst"
• gleichzeitig Modul 1 des CAS-Zertifikatsstudiums "Data Scientist"
Format Das Modulstudium wird online durchgeführt. Die Inhalte werden selbstständig anhand angeleiteter Online-Lerneinheiten auf der Lernplattform der HSB erarbeitet. Dazu finden die begleitenden Live-Online-Seminare statt, welche die virtuelle Anwesenheit der Teilnehmenden erfordern. Die Online-Seminare dienen der thematischen Einführung, der Vermittlung erklärungsbedürftiger Inhalte sowie der Besprechung der Fallstudien, an denen während der Weiterbildung gearbeitet wird.
Methoden Kombination aus Online-Lerneinheiten, Online-Seminar, Übungen und Fallstudienarbeit
Aufwand 60 Kontaktstunden plus ca. 120 Std. Selbststudium (nach individuellem Bedarf)
Dauer 5 Online-Seminare à 4 Unterrichtsstunden, 40 Unterrichtsstunden E-Learning, zzgl. Prüfungsleistung, ca. 3 Monate insgesamt
Prüfung Hausarbeit in Form einer Fallstudie, welche die a) Konzeption und b) Implementierung eines praxisnahen und realisierbaren Big Data Use Cases und c) die Demonstration von Techniken zur Muster- und Ausreißer-Identifikation mit Python beinhaltet
Abschluss Hochschulzertifikat nach erfolgreich abgelegter Prüfung

6 ECTS-Leistungspunkte für Teilnehmende mit Hochschulzugangsberechtigung

Teilnahmebescheinigung, sofern keine Prüfung abgelegt wird
Preis 1.490,00 €