Zunächst fokussierte sich das Thema Big Data auf die Daten selbst, also die Beschaffung, Zusammenführung, Speicherung und Verarbeitung großer Datenmengen. Doch letztlich sind die Daten selbst nicht das eigentliche Ziel, sondern die Erlangung neuer Erkenntnisse aus den Daten.

Data Science

Data Mining

Data Mining setzt an der Auswertung von Daten an, und zwar mit modernen Verfahren bei denen der Computer selbständig Zusammenhänge erkennt. Doch obgleich automatisches Lernen das Versprechen vom Machine Learning darstellt, ist der Weg von den Daten zur Erkenntnis noch lange nicht vollständig automatisierbar. Und hier setzt der sich neu entwickelte Bereich der Data Science an, der an der Schnittstelle zwischen Software Entwicklung und Statistik liegt.

Fast immer ist ein Wissen um die Semantik der Daten unerlässlich, um durch geeignete Extraktions- und Transformationsschritte das maschinelle Lernen überhaupt erst zu ermöglichen. Zudem sind Grundlagen aus der Statistik unerlässlich, um die passenden Verfahren auszuwählen und die Daten richtig aufzubereiten.

Was dimajix bietet

Als Experte auf dem Gebiet des maschinellen Lernens unterstützt dimajix Sie dabei, Ihre Fragestellungen anhand Ihrer Daten zu beantworten. Sie erhalten die Erfahrung aus mehr als zehn Jahre Software-Entwicklung zusammen mit dem Wissen aus einem erfolgreichen Mathematikstudiums.