Skip to main content

Zielgruppe

Dieser spezielle Kurs wendet sich an Mitarbeiter, die sich als Data Scientist mit der Datenauswertung beschäftigen und hierfür die Hadoop Platform und Apache Spark einsetzen möchten.

Agenda

Apache Spark bietet eine wachsende Zahl von Machine Learning Verfahren, mit denen sich das dritte Paket ausführlich beschäftigt. Anhand verschiedener Beispieldaten und Fragestellungen werden die unterschiedlichen Machine Learning Verfahren und deren Nutzung in Spark in praktischen Übungen erläutert.

Je nach Publikum kann die Schulung sowohl für Mitarbeiter mit Erfahrung in der Datenanalyse ausgestaltet werden, so dass primär die neuen Werkzeuge im Mittelpunkt stehen. Alternativ kann der Kurs auch eine Einführung in die maschinelle Datenanalyse mit beinhalten.

  • Einführung in das Hadoop Ökosystem (HDFS, YARN, Hive, …) (optional, ca 1 Tag)
  • Spark Cluster Architektur
  • Spark DataFrame API
  • Spark ML API
  • Feature Extraktion und Transformation
  • Regressionsanalysen
  • Klassifikation
  • Spark ML Pipelines

Alle Verfahren werden anhand von Beispielen mit echten, öffentlich verfügbaren Daten erläutert. Auf diese Weise erhalten die Teilnehmer nicht nur einen theoretischen Einblick, sondern lernen auch gleich, wie Eigenheiten der Datensätze zu berücksichtigen sind, um gute Resultate zu erzielen.

 

Benötigte Kenntnisse

Die Teilnehmer sollten über grundlegende Programmier- und SQL Kenntnisse verfügen. Die Programmierbeispiele und Übungen werden wahlweise in Python oder in Scala umgesetzt. In Python finden sich Teilnehmer erfahrungsgemäß schnell ein. Für Scala kann optional  eine Einführung durchgeführt werden, aus der Erfahrung sollte hierfür allerdings ein ganzer Tag reserviert werden.

Technische Voraussetzung

Da der Kurs sehr viele praktische Übungen beinhaltet, sollten die Teilnehmer über eigene Rechner verfügen. Um ein möglichst realistisches Erlebnis zu ermöglichen, erhält jeder Teilnehmer ein eigenes kleines Cluster innerhalb der Amazon Cloud, der Zugriff erfolgt über SSH und den Web-Browser. . Damit wird neben einem Web-Browser auch keine weitere Software auf den Computern der Teilnehmer benötigt.

Veranstaltungsort und Sprache

Der Kurs ist als In-House Schulung bei Ihnen vor Ort angelegt und kann wahlweise in deutscher oder englischer Sprache durchgeführt werden. Zudem kann die Schulung auch mittels Videokonferenz remote durchgeführt werden – fragen Sie einfach nach.

Training Data ScienceEmpfehlung

3.844

für 2 Tage und 8 TeilnehmerKontaktieren Sie uns
für ein Angebot

Training Data Science

5.766

für 3 Tage und 8 TeilnehmerKontaktieren Sie uns
für ein Angebot

Die Preise beziehen sich auf In-House Schulungen in Ihrem Unternehmen und für die angegebene Teilnehmerzahl. Zu den angegebenen Preisen fallen ggf noch zusätzlich Reisekosten für den Dozenten an. Alternativ kann die Schulung auch remote durchgeführt werden.

Um die Schulungsqualität zu garantieren ist die Kursgröße auf 12 Teilnehmer begrenzt. Bei Remote-Schulungen liegt die Grenze bei 8 Teilnehmern.

Alle Preise verstehen sich zuzüglich der jeweils geltenden Umsatzsteuer.

Anfrage:

 

    Ihr Name (Pflichtfeld)

    Ihre E-Mail-Adresse (Pflichtfeld)

    Betreff (Pflichtfeld)

    Ihre Nachricht (Pflichtfeld)

    ×