Big Data-Verarbeitung & Datenintegration

Rich Data-Integration und Transformationsfunktionen

Das Modul für Big Data-Verarbeitung & Datenintegration ist auf hohe Leistung und Skalierbarkeit ausgelegt. Es bietet umfangreiche Funktionen, die auf eine Vielzahl von Datentransformations-Anforderungen reagieren. Mit diesem Modul können Sie die Daten in Ihrem Datensee (Data Lake) analysieren, riesige Datenmengen verarbeiten und eine detaillierte Datenqualitätsanalyse durchführen, bevor etwaige Daten transformiert werden.

Anwendungsfälle

Datenverarbeitung

Es können alle Arten von Transformation, Aggregation oder Modifikation durchgeführt werden. Daten werden zwischen Datenquellen übertragen oder aus verschiedenen Quellen zusammengeführt. Das beschleunigt die Datenaufbereitung erheblich und steigert die Effizienz des Datenermittlungsprozesses.

Datenvorverarbeitung für Data-Engineers, Data-Scientists & Business-Anwender

Ataccama ONE bietet Ihnen neben einer Reihe von vorgefertigten Datenzugriffs- und Vorbereitungskomponenten auch eine umfangreiche Benutzeroberfläche für Data-Engineers. Integrationskomponenten können miteinander kombiniert werden (Orchestration). Für Business-Anwender stehen Datenanalysen und erweiterte semantische Profiling-Funktionen zur Verfügung.

Data Lake-Profiling, Integration & Datenkatalog

Traditionelle Datenquellen können ganz einfach in Hadoop oder einen Datensee integriert werden. Eine nahtlose Datenmigration wird so möglich. Ergebnisse können Sie in einem Datenkatalog teilen.

Weitere Anwendungsfälle

Text Analytics und maschinelles Lernen

Anwendungsfälle umfassen die Extraktion von Entitäten, Sentimentanalyse und Klassifizierung. Diese Funktionen werden in Hadoop unterstützt. Integration mit Spark 2 MLlib kann genutzt werden, um maschinelles Lernen und Text-Analytics-Modelle auf Ihre Datensätze anzuwenden (Klassifizierung, Clustering, Regression usw.).

Datenanreicherung (Enrichment) aus externen Quellen

Datensätze können aus externen Datenquellen abgerufen werden. Für die Überprüfung und Validierung von Eingaben greift das Modul auf Namens-, Firmen-, Titel- und andere Verzeichnisse zurück. Die Verzeichnisse und die Anwendungsregeln können einfach erweitert und angepasst werden.

Datenintegration (Echtzeit & Streaming)

Ataccama ONE erfüllt die wachsende Nachfrage nach Datenverarbeitung in Echtzeit, ermöglicht die Integration von Maschinendaten und unterstützt IoT sowie Spark-Streaming (Amazon Kinesis, Apache Flume).

Datenqualität

Ataccama ONE fungiert als zentrale Datenqualitätsplattform (Data Hub) für Ihre Daten. Integrieren und verwalten Sie Daten aus vielen verschiedenen Quellen auf einer einzigen Plattform.


Suchen Sie nach einem anderen Anwendungsfall?
Kontaktieren Sie uns

Produkteigenschaften

Nahtlose Datenmigration

Eine nahtlose Datenmigration zwischen lokalen und Big Data-Umgebungen ist möglich, da bestehende Konfigurationen in jeder Umgebung ohne Änderungen oder Neukompilierung ausgeführt werden können.

Datensee-konform

Sie können Ihre Daten mit externen Quellen anreichern, integrieren oder transformieren. HDFS, Azure Data Lake Storage, Amazon S3 und andere S3-kompatible Objektspeicher werden unterstützt. AWS-Glue-Datenkatalog, Hive, HBase, Kafka, Avro, Parquet, ORC, TXT, CSV und Excel werden ebenfalls unterstützt.

Support für Elastic Computing/ bedarfsgesteuerte Big Data-Verarbeitung

In automatisch bereitgestellten Clustern können Sie Ihre Daten verarbeiten und bereinigen. Azure HDInsight-, Amazon EMR-, Google Dataproc-, Databricks-, Cloudera-, Hortonworks- und MapR-Cluster werden unterstützt. MapReduce-, Spark- und Spark 2-Engines werden verwendet.

Native Unterstützung von Hadoop MapReduce & Apache Spark

Alle Berechnungs- und Verarbeitungsprozesse werden direkt in einem Cluster ausgeführt, ohne dass Daten aus Hadoop extrahiert werden müssen. Die Verarbeitungsschritte werden in eine Reihe von MapReduce-Jobs übersetzt oder sie werden direkt mit Spark ausgeführt. Ataccama ONE unterstützt alle wesentlichen Hadoop-Distributionen.

Andere Funktionen

Ausgefeiltes Profiling

Es steht Ihnen ein Tool zur Verfügung, das schnelle Datenanalyse mit erweiterten semantischen Profiling-Funktionen verbindet.

Support für IoT & Spark-Streaming

Streaming-Integration mit Apache Kafka, Apache NiFi und Amazon Kinesis.

Erweiterte Kernfunktionen

Intelligente Algorithmen werden zum Datenabgleich und zur Vorbereitung für die Datenkonsolidierung eingesetzt. Unscharfes, annäherndes Matching liegt hier zugrunde. Der Matching-Algorithmus kann auf alle Daten angewendet werden und mit jeder internen Datenstruktur arbeiten.

Rich Data-Integration & Datenaufbereitungsfunktionen

Data-Engineers und Data-Scientists können ihre Datenbestände in einem Datensee oder in der Cloud darstellen, bewerten, transformieren und zusammenfügen.


Haben Sie auf unserer Seite nicht das gefunden, wonach Sie gesucht haben?
Kontaktieren Sie uns

Erfahrungsberichte von Kunden

Erfahrungsberichte (nach Branchen geordnet)

Jetzt lesen

Die Ataccama ONE Plattform

Wir verwenden Cookies auf unserer Website, um Ihre Browser-Erfahrung zu verbessern. Durch die Nutzung unserer Website stimmen Sie der Verwendung von Cookies zu. Um mehr darüber zu erfahren, wie wir Cookies verwenden oder wie Sie Ihre Browsereinstellungen ändern, lesen Sie bitte unsere Datenschutzbestimmungen.

Weitere Informationen
Schließen