Skip to content

Latest commit

 

History

History
1064 lines (1001 loc) · 123 KB

File metadata and controls

1064 lines (1001 loc) · 123 KB

Apache

Airflow

Ambari

Apex 스트림 및 배치 프로세스 엔진

Atlas 데이터 거버넌스, 표준, 계보 관리 플랫폼

Beam (Former DataFlow)

BookKeeper

Cordova

Eagle

Flume

HAWQ - advanced enterprise SQL-on-Hadoop query engine and analytic database

Ignite - Spark Shared RDDs

Impala

Kafka

Kafka Library

Kafka Stream

Kylin Extreme OLAP Engine for Big Data

Metron 보안에 포커스를 둔 분석 시스템

Nifi Apache nifi is an easy to use, powerful, and reliable system to process and distribute data

Ozone

Phoenix High performance relational database layer over HBase for low latency applications

Pinot

Pulsar 기존의 메시징/스트리밍 시스템의 단점을 보완하기 위해 Yahoo에서 시작된 분산형 pub-sub 시스템

Samza

SINGA a general distributed deep learning platform for training big deep learning models over large datasets

Slider

Solr

Spot 네트워크 데이터를 분석하여 infosec 위협을 탐지하는데 사용

  • Apache Spot (incubating) and Cloudera on AWS in 60 Minutes
    • Apache Kafka(처리용), Apache Spark(처리 및 ML 분석용), Apache Hadoop(처리 및 저장용) 등을 기반으로 한 Apache Spot의 아키텍처 소개
    • Spot은 파일 시스템의 변경 사항을 감지하고 이벤트를 발생시키는 Python Watchdog 라이브러리를 사용

Sqoop

Storm

Superset

SystemML Apache Spark와 Apache Hadoop을 확장하기 위해 빌드된 machine learning 라이브러리

Thrift

WEEX A framework for building Mobile cross-platform UIs