PONI's 좋은 개발자

[Trino] Trino 본문

ETL/Trino

[Trino] Trino

PONI 2024. 1. 8. 10:47
반응형

📋Trino

Trino는 데이터 쿼리 및 분석 도구로 사용되는 오픈 소스 소프트웨어입니다.

 

 

  • 빅데이터를 쿼리하기 위한 분산 SQL 쿼리 엔진입니  .
  • 초기에 HDFS를 쿼리하기 위해 설계되었으나, 현재는 그것에 국한되지 않고 다양한 데이터 소스를 지원합니다.
  • Presto라고 불렸던 동일한 쿼리 엔진을 리브랜딩한 것으로, 이전의 Presto와 동일한 기능과 능력을 제공합니다.
  • 범용 데이터베이스가 아닌 OLAP(Online Analytics Processing)를 위해 설계되었으므로 MySQL과 같은 OLTP(Online Transaction Processing) 데이터베이스와는 다릅니다.

 

📌Presto

presto는 페이스북이 최초 개발하여 오픈 소스로 공개한 대화식 데이터 쿼리 서비스입니다. 

  • 다양한 데이터베이스에 대한 일관된 ANSI SQL 질의가 가능합니다.
  • 빠른 속도를 보장하기 위해 엔진 레벨에서 분산 컴퓨팅 기법이 사용됩니다.
  • 2020년 12월 27일에 PrestoSQL 프로젝트가 Trino로 리브랜딩 됐습니다.

 

📖특징

  • Trino 는 두가지의 서버타입이 있습니다. Coordinator type과 Worker type 입니다. Coordinator는 구문 분석, 쿼리 계획, 작업자 노드 관리와 같은 일을 하며 Worker는 실제 작업을 실행하고 데이터 처리를 담당합니다. 연결된 Connector에서 데이터를 가져오고 중간 데이터를 교환합니다. rest API를 사용하여 Coordinator와 Worker가 통신합니다.
  • 빠른 쿼리 성능 : 대규모 데이터에서 빠른 쿼리 성능을 제공합니다. 이를 통해 사용자는 실시간 분석 및 대화형 쿼리 실행이 가능합니다.
  • 다양한 데이터 소스 지원 : 여러 데이터 소스에서 데이터를 효율적으로 쿼리 및 조작할 수 있습니다. 데이터 소스에는 관계형 데이터베이스, NOSQL, Cloud Storage 등이 포함됩니다.
  • 스케일 아웃 : 클러스터를 구성하여 대용량 데이터에 대한 쿼리 처리 능력을 확장할 수 있습니다. 
  • SQL 호환성 : 표준 SQL 문법을 준수하며, 사용자는 익숙한 SQL 쿼리를 사용하여 데이터에 액세스하고 조작할 수 있습니다.

 

🔗참조

https://pandio.com/difference-between-trino-and-prestodb/

https://blog.metafor.kr/239

 

반응형
Comments