Big Data Engine

Die Big Data Engine von Ataccama ist für hohe Leistung, Skalierbarkeit und schnelle Verarbeitung großer Datenmengen ausgelegt.

Big Data Engine

BDE bietet umfangreiche Funktionen zur Datenqualitätsanalyse. Mit BDE können Sie Schwerpunkte setzen und detaillierte Datenqualitätsanalysen für verschiedene Bereiche durchführen.

Nutzen Sie BDE von Ataccama für

  • Übertragung großer Datenmengen (Big Data) von und nach Hadoop
  • Datenverarbeitung (im Online- oder Batchmodus)
  • Transformationen, Aggregationen, Datenanreicherung (Enrichment) usw.
  • Qualitätskontrolle bei Transaktions und Analyseanwendungen
  • Datenbereinigung (Cleansing) und -zusammenführung bei Systemmigrationen
  • Qualitätssicherung bei Softwareintegrationsprojekten
  • Data quality improvement in address and contact information
  • Continuous DQ monitoring with a business-friendly interface
  • Cleansing and unification of data for client identification purposes
  • Profile validation and correction of incomplete records
  • Customer input validation in self-service online applications
  • Profiling as a part of data integration project analysis
  • Detection of inconsistencies and irregular patterns for fraud prevention and more
  • Data preparation for other further analytical use

Vielfältige Funktionen und hohe Performanz

BDE kann alle oben genannten Aufgaben in einem Hadoop-Cluster ausführen. Die Daten werden mithilfe von MapReduce oder Apache Spark verarbeitet. So wird die Big Data Engine auf die Verarbeitung großer und sehr großer Datenvolumen ohne Leistungseinbußen skaliert.

Datenintegration

BDE stellt Konnektoren für die Anbindung an Hadoop bereit. Zwischen vorhandenen Datenquellen und Hadoop erfolgt so ein nahtloser Datentransfer.

Datenverarbeitung

BDE ermöglicht es Benutzern, jede Art von Transformation, Aggregation oder Modifikation durchzuführen. Daten werden zwischen Datenquellen übertragen oder aus verschiedenen Quellen zusammengeführt. Das beschleunigt die Datenaufbereitung erheblich und steigert die Effizienz des Datenermittlungsprozesses.

Ausgefeiltes Data-Profiling

Die Datenanalyse ist sehr schnell. Modernes Profiling, das Methoden der semantischen Analyse nutzt, wird hier eingesetzt.

Datenqualität

BDE fungiert als Hauptdrehscheibe (Data Hub) für Ihre Datenqualitätsverwaltung. Dies ermöglicht die Integration und Verwaltung von Daten unterschiedlicher Herkunft auf einer einzigen Plattform.

Text analytics

BDE kann auch für Text-Mining eingesetzt werden. Anwendungsfälle umfassen die Extraktion von Entitäten, Sentimentanalyse und Klassifizierung. Diese Funktionen werden in Hadoop unterstützt und so können auch große Textmengen verarbeitet werden.

Kosteneffizient

BDE bietet ein umfassendes Leistungsspektrum, ist kosteneffizient und lässt sich schnell und einfach einsetzen.

Flexibilität und Offene Standards

BDE lässt sich einfach in einer mitgelieferten Administrations-Oberfläche konfigurieren. Das Modul ist plattformunabhängig, basiert auf Open Standards (XML, Web Services) und verwendet Datenmodelle, die auf alle gängigen Datenbank-Plattformen übertragbar sind.

Datenanreicherung (Enrichment) aus externen Quellen

BDE kann Datensätze aus externen Datenquellen abrufen. Für die Überprüfung und Validierung von Eingaben greift BDE auf Namens-, Firmen-, Titel- und andere Verzeichnisse zurück. Die Verzeichnisse und die Anwendungsregeln können einfach erweitert und angepasst werden.

Automatische Dokumentation

BDE protokolliert die Ausführung jedes Schrittes sowie alle angewendeten Business-Rules. Die Protokolle werden automatisch erstellt und sind auditkonform.

Erweiterte Kernfunktion

Intelligente Algorithmen können einen Abgleich für eine Datensatzvereinheitlichung durchführen.

Native Unterstützung von Hadoop MapReduce und Apache Spark

Alle Berechnungs- und Verarbeitungsprozesse werden direkt in einem Cluster ausgeführt, ohne dass Daten aus Hadoop extrahiert werden müssen. Die Verarbeitungsschritte werden in eine Reihe von MapReduce-Jobs übersetzt oder sie werden direkt mit Spark ausgeführt. BDE unterstützt alle wesentlichen Hadoop-Distributionen.

Wir verwenden Cookies auf unserer Website, um Ihre Browser-Erfahrung zu verbessern. Durch die Nutzung unserer Website stimmen Sie der Verwendung von Cookies zu. Um mehr darüber zu erfahren, wie wir Cookies verwenden oder wie Sie Ihre Browsereinstellungen ändern, lesen Sie bitte unsere Datenschutzbestimmungen.

Weitere Informationen
Schließen