Von Big Data zu Machine Learning

Jedes Big Data Projekt beginnt damit, relevante Daten aus dem Unternehmen zu beschaffen, zu speichern und zusammenzuführen. Doch letztlich sind die Daten selbst nicht das eigentliche Ziel, sondern anhand von Erkenntnisse aus den Daten entweder bestehende Geschäftsprozesse zu optimieren oder neue Geschäftsmöglichkeiten zu erschließen. An diesem Punkt setzt Data Science an, das mit einer fundierten wissenschaftlichen Methodik die Daten analysiert. Ein wichtiger Werkzeugkasten hierzu sind Algorithmen aus dem Bereich Machine Learning.

Data Science

Wertschöpfung durch Machine Learning & Data Mining

Machine Learning und Data Mining sind die Werkzeuge um Daten zu erschließen und Modelle zur Vorhersage zu entwickeln. Mit Hilfe dieser Modelle können Entscheidungen in Geschäftsprozesse durch Vorhersagen unterstützt oder gar vollständig automatisiert werden. Der von uns verfolgte Ansatz ist iterativ und jeder Zyklus besteht aus den folgenden fünf Schritten

1. Datenerfassung

2. Exploration

3. Feature Engineering

4. Modellierung

5. Operationalisierung

Was dimajix bietet

Als Experte auf dem Gebiet des maschinellen Lernens unterstützt dimajix Sie dabei, Ihre Fragestellungen anhand Ihrer Daten zu beantworten. Sie erhalten die Erfahrung aus mehr als zehn Jahre Software-Entwicklung zusammen mit dem Wissen aus einem erfolgreichen Mathematikstudiums.

Methoden und Modelle

  • Feature Engineerung & Selection
  • Predictive Modeling
  • Klassifikation & Regression
  • Clusterverfahren & Anomaly Detection
  • Zeitreihenanalyse

Unsere Werkzeuge

  • Python, SciPy
  • Apache Spark
  • Tensorflow
  • Weitere Open Source Tools

Unsere Erfahrungen

  • Forschung & Entwicklung
  • Finanzinstitute
  • Marketing & Online Advertising