Обработка и интеграция больших данных в Ataccama ONE спроектированы высокопроизводительными и масштабируемыми, а также предоставляют различные встроенные инструменты, позволяющие реализовать самые разные потребности в преобразовании данных. Используйте Ataccama ONE, чтобы быстро понять и исследовать данные в вашем озере данных, быстро обработать огромные объемы данных и провести подробный анализ качества данных перед выполнением необходимых преобразований.
Выполняйте любые преобразования, агрегацию или модификацию с перемещением данных из одного хранилища в другое, соединяйте данные из различные источников в единое целое или готовьте данные для дальнейшего анализа. Сократите время, требуемое для сбора данных, повысьте эффективность процесса их обнаружения и насладитесь быстрой обработкой вычислений или работой с большими данными по запросу.
Ataccama ONE включает в себя ряд готовых компонентов для доступа к данным и для их подготовки, богатый графический интерфейс для инженеров данных и солидный набор компонентов для интеграции. Наслаждайтесь анализом данных и расширенными возможностями семантического профилирования, предназначенными для бизнес-пользователей.
Профилируйте, подготавливайте, обрабатывайте и интегрируйте большие данные из вашего озера данных. Легко и просто интегрируйте традиционные источники данных с Hadoop или озерами данных для обеспечения беспрепятственной миграции данных по мере необходимости, открытия новых активов и возможности размещать полученные результаты в каталоге данных.
К вариантам использования относятся извлечение именованных объектов, проведение смыслового анализа и классификации, а также всего остального, что имеет встроенную реализацию в Hadoop. Интеграция со Spark 2 MLlib может использоваться для применения моделей машинного обучения и текстовой аналитики к вашим наборам данных (классификация, кластеризация, регрессия и т. д.).
Легко подключайтесь к внешним источникам данных для извлечения записей. Используйте имя, организацию, название и другие словари для проверки и подтверждения входных данных. Расширьте эту функциональность с помощью настраиваемых переменных, адаптированных к индивидуальным потребностям.
Ataccama ONE шагает в ногу с растущим спросом на обработку данных в режиме реального времени и позволяет пользователям интегрировать машинные данные, поддерживает интернет вещей (IoT) и Spark Streaming (Amazon Kinesis, Apache Flume).
Используйте Ataccama ONE в качестве центрального узла для управления качеством данных. Интегрируйте данные и управляйте ими из всех источников с помощью одной платформы.
Целостная миграция
Между средами с локальными и большими данными существующие конфигурации могут быть запущены в любой среде без каких-либо изменений или перекомпиляции.
Готовность к работе с озерами данных
Интегрируйте, преобразуйте и обогащайте ваших данные из внешних источников благодаря поддержке HDFS, Azure Data Lake Storage, Amazon S3 и других хранилищ объектов, совместимых с S3. Также поддерживаются AWS Glue Data Catalog, Hive, HBase, Kafka, Avro, Parquet, ORC, TXT, CSV и Excel.
Поддержка эластичных вычислений и/или обработка больших данных по запросу
Профилируйте, обрабатывайте и очищайте данные в автоматически созданных кластерах благодаря поддержке Azure HDInsight, Amazon EMR, Google Dataproc, Databricks, Cloudera, Hortonworks и MapR. При этом используются движки MapReduce, Spark и Spark 2.
Встроенная поддержка Hadoop MapReduce и Apache Spark
Все вычисления и обработка выполняются непосредственно на кластере, без необходимости удалять данные из Hadoop. На основании характеристики кластера решение автоматически преобразуется в серию заданий MapReduce или непосредственно использует Spark. Ataccama ONE поддерживает все основные дистрибутивы Hadoop.
Уникальное профилирование
Наслаждайтесь быстрым анализом данных и расширенными возможностями семантического профилирования.
Поддержка интернета вещей и Spark Streaming
Включает потоковую интеграцию с Apache Kafka, Apache NiFi и Amazon Kinesis.
Расширенная функциональность ядра
Набор алгоритмов, способных к иерархическому объединению по идентификационным ключам, независимо от внутренней структуры данных, может выполнять приблизительное сопоставление в процессе объединения записей.
Богатые возможности интеграции и преобразования данных
Для инженеров данных и аналитиков данных. Профилируйте, оценивайте, изменяйте и объединяйте ваши наборы данных в озере данных и облаке.
Ознакомьтесь с тематическими исследованиями в интересующих вас направлениях.
Читать сейчас