본문 바로가기
IT/DB

Snowflak 오브젝트 및 용어

by 조병희 2023. 3. 22.

Snowflake에서 사용되는 오브젝트 종류는 다음과 같습니다.

  1. 태스크(task): 태스크는 일정한 주기로 실행되거나, 특정 이벤트가 발생할 때 실행되는 작업을 정의하는 오브젝트입니다. 태스크를 사용하여 ETL(Extract, Transform, Load) 작업, 데이터 통합 작업 등을 자동화할 수 있습니다.
  2. 스트림(stream): 스트림은 데이터 변경을 캡처하고, 다른 테이블(table)이나 스트림(stream)에 전달하는 오브젝트입니다. 스트림을 사용하여 데이터 변경 이벤트를 감지하고, 실시간 데이터 통합을 수행할 수 있습니다.
  3. 인티그레이션(integration): 인티그레이션은 다른 클라우드 서비스나 데이터 소스와 연결하기 위한 구성 요소입니다. 인티그레이션을 사용하여 Amazon S3, Azure Blob Storage, Google Cloud Storage 등의 데이터 소스와 연결할 수 있습니다.
  4. 스키마 변경 로그(schema change log): 스키마 변경 로그는 스키마(schema) 변경 내역을 추적하는 오브젝트입니다. 스키마 변경 로그를 사용하여 스키마 변경 내역을 추적하고, 변경 내역을 롤백할 수 있습니다.
  5. 시트(sheet): 시트는 스프레드시트와 유사한 형태로 데이터를 시각화하는 오브젝트입니다. 시트를 사용하여 대시보드를 작성하거나, 데이터 시각화를 수행할 수 있습니다.
  6. 모니터(monitor): 모니터는 클러스터(cluster) 및 웨어하우스(warehouse)의 성능, 상태 등을 모니터링하는 오브젝트입니다. 모니터를 사용하여 클러스터 및 웨어하우스의 성능 이슈를 식별하고, 최적화 작업을 수행할 수 있습니다.
  7. 역할(role): 역할은 사용자(user)에게 특정 권한을 할당하는 오브젝트입니다. 역할을 사용하여 데이터베이스의 보안을 관리할 수 있습니다.
  8. 권한(permission): 권한은 데이터베이스 오브젝트에 대한 접근 권한을 정의하는 오브젝트입니다. 권한을 사용하여 데이터베이스의 보안을 관리할 수 있습니다.
  9. 큐(queue): 큐는 메시지를 보내고 받기 위한 오브젝트입니다. 큐를 사용하여 데이터의 비동기적인 처리를 수행할 수 있습니다.
  10. 태그(tag): 태그는 데이터베이스 오브젝트에 대한 레이블을 정의하는 오브젝트입니다. 태그를 사용하여 데이터베이스 오브젝트를 그룹화하거나, 검색하기 쉽게 만들 수 있습니다.
  11. 스토리지 정책(storage policy): 스토리지 정책은 데이터베이스 오브젝트의 저장 위치와 보존 기간 등을 정의하는 오브젝트입니다. 스토리지 정책을 사용하여 데이터의 보존 기간을 관리하고, 비용을 최적화할 수 있습니다.
  12. 타임스탬프(timestamp): 타임스탬프는 데이터베이스 오브젝트에 대한 생성 시간, 수정 시간 등의 정보를 저장하는 오브젝트입니다. 타임스탬프를 사용하여 데이터베이스 오브젝트의 변경 내역을 추적할 수 있습니다.
  13. 확장(extensions): 확장은 Snowflake에서 제공하는 기능을 확장하거나, 사용자 정의 기능을 추가하는 오브젝트입니다. 확장을 사용하여 사용자 정의 함수나 데이터 형식을 추가할 수 있습니다.
  14. 알림(notification): 알림은 이메일, SMS 등의 방법으로 이벤트를 알리는 오브젝트입니다. 알림을 사용하여 데이터베이스 오브젝트의 변경 내역을 실시간으로 감지할 수 있습니다.
  15. 리소스 모니터링(resource monitoring): 리소스 모니터링은 Snowflake에서 사용되는 리소스의 사용량을 추적하고, 최적화하는 오브젝트입니다. 리소스 모니터링을 사용하여 웨어하우스(warehouse)의 성능을 최적화하고, 비용을 줄일 수 있습니다.
  16. 데이타베이스 엔진(database engine): 데이타베이스 엔진은 데이타베이스의 중앙 컴포넌트로, SQL 처리, 데이터 관리, 보안 등의 기능을 제공하는 오브젝트입니다.
  17. 웨어하우스 엔진(warehouse engine): 웨어하우스 엔진은 웨어하우스의 분산 처리 및 병렬 처리를 담당하는 오브젝트입니다. 웨어하우스 엔진은 다양한 유형의 웨어하우스를 제공합니다.
  18. 클라우드 서비스(cloud service): 클라우드 서비스는 Snowflake에서 사용되는 다른 클라우드 서비스와의 연결을 위한 오브젝트입니다. 클라우드 서비스를 사용하여 AWS, Azure, Google Cloud 등의 클라우드 서비스와 연결할 수 있습니다.
  19. 세션(session): 세션은 사용자(user)가 Snowflake에 연결되어 있는 동안의 상태를 저장하는 오브젝트입니다. 세션을 사용하여 사용자의 접속 시간, 상태 등을 추적할 수 있습니다.
  20. 데이터베이스 객체(database object): 데이터베이스 객체는 데이터베이스에 저장되는 모든 오브젝트를 포함하는 범용적인 용어입니다. 데이터베이스 객체에는 데이터베이스(database), 스키마(schema), 테이블(table), 뷰(view), 함수(function) 등이 포함됩니다.
  21. 파이프(pipes): 파이프는 스트림(stream)과 유사하게 데이터를 캡처하고, 다른 테이블(table)이나 스트림(stream)에 전달하는 오브젝트입니다. 파이프를 사용하여 실시간 데이터 파이프라인을 구축할 수 있습니다.
  22. 프로파일러(profiler): 프로파일러는 쿼리(query)의 실행 계획과 성능을 분석하는 오브젝트입니다. 프로파일러를 사용하여 쿼리의 성능 이슈를 분석하고, 최적화 작업을 수행할 수 있습니다.
  23. 데이타 마스킹(data masking): 데이타 마스킹은 민감한 데이터를 가려서 표시하는 작업을 말합니다. 데이타 마스킹을 사용하여 민감한 데이터를 안전하게 처리할 수 있습니다.
  24. 캡처(capture): 캡처는 데이터 변경을 캡처하고, 다른 테이블(table)이나 스트림(stream)에 전달하는 오브젝트입니다. 캡처를 사용하여 데이터 변경 이벤트를 감지하고, 데이터 통합을 수행할 수 있습니다.
  25. 레코드(record): 레코드는 테이블(table)에서 하나의 행(row)을 나타내는 데이터의 집합입니다. 레코드는 열(column)에 대응되는 값들로 구성됩니다.
  26. 샘플링(sampling): 샘플링은 대규모 데이터에서 일부 데이터를 추출하는 작업을 말합니다. 샘플링을 사용하여 대규모 데이터를 빠르게 분석하고, 쿼리 수행 시간을 최적화할 수 있습니다.
  27. 시퀀스(sequence): 시퀀스는 일련의 숫자를 생성하는 오브젝트입니다. 시퀀스를 사용하여 일련번호를 생성하거나, 고유한 식별자를 생성할 수 있습니다.
  28. 유저(user): 유저는 Snowflake에 접속하는 사용자를 나타내는 오브젝트입니다. 유저는 데이터베이스 오브젝트에 대한 접근 권한을 가지고 있으며, 역할(role)을 통해 권한을 할당받습니다.
  29. 데이터베이스 링크(database link): 데이터베이스 링크는 Snowflake과 다른 데이터베이스 간에 연결을 설정하는 오브젝트입니다. 데이터베이스 링크를 사용하여 다른 데이터베이스의 데이터를 읽거나 쓸 수 있습니다.
  30. 스키마 플랜(schema plan): 스키마 플랜은 스키마(schema) 변경 시 변경 내용을 미리 확인할 수 있는 기능입니다. 스키마 플랜을 사용하여 스키마 변경에 대한 예상 결과를 미리 확인하고, 변경 내용을 롤백할 수 있습니다.
  31. 노드(node): 노드는 Snowflake 클러스터(cluster)에서 실행되는 컴퓨팅 노드를 나타내는 오브젝트입니다. 노드를 사용하여 클러스터의 상태를 모니터링하고, 클러스터의 구성을 변경할 수 있습니다.
  32. 파티션(partition): 파티션은 테이블(table)의 데이터를 분할하는 기능입니다. 파티션을 사용하여 대규모 데이터를 처리하고, 쿼리 수행 시간을 최적화할 수 있습니다.
  33. 데이타베이스 암호화(database encryption): 데이타베이스 암호화는 데이터베이스 내의 데이터를 암호화하여 보호하는 기능입니다. 데이타베이스 암호화를 사용하여 민감한 데이터를 안전하게 보호할 수 있습니다.
  34. 접속 권한(access control): 접속 권한은 데이터베이스 오브젝트에 대한 접근 권한을 관리하는 기능입니다. 접속 권한을 사용하여 데이터베이스의 보안을 강화할 수 있습니다.
  35. 공유(shared): 공유는 Snowflake 클라우드 데이터 웨어하우스를 다른 조직과 공유할 수 있는 기능입니다. 공유를 사용하여 데이터를 안전하게 공유하고, 협업을 향상시킬 수 있습니다.
  36. 데이터베이스 복제(database replication): 데이터베이스 복제는 데이타베이스의 내용을 다른 데이타베이스에 복사하는 기능입니다. 데이터베이스 복제를 사용하여 데이터베이스의 백업 및 복구를 수행하고, 재해 복구를 위한 대비책을 마련할 수 있습니다.
  37. 재시도(retry): 재시도는 쿼리(query)나 작업(task)이 실패할 때 자동으로 다시 시도하는 기능입니다. 재시도를 사용하여 쿼리나 작업의 성공률을 향상시킬 수 있습니다.
  38. 비동기 처리(asynchronous processing): 비동기 처리는 작업(task)이나 쿼리(query)가 완료될 때까지 기다리지 않고, 다른 작업을 수행하는 기능입니다. 비동기 처리를 사용하여 작업을 병렬 처리하고, 처리 속도를 향상시킬 수 있습니다.
  39. 데이타 분석(data analytics): 데이타 분석은 데이타베이스의 내용을 분석하여 인사이트를 도출하는 기능입니다. 데이타 분석을 사용하여 비즈니스 의사결정에 필요한 정보를 추출하고, 경쟁 우위를 확보할 수 있습니다.
  40. 마스터 키(master key): 마스터 키는 데이타베이스 오브젝트를 암호화하는데 사용되는 키(key)입니다. 마스터 키를 사용하여 민감한 데이터를 안전하게 암호화할 수 있습니다.
  41. 고정 뷰(materialized view): 고정 뷰는 쿼리(query) 결과를 미리 계산하여 저장하는 오브젝트입니다. 고정 뷰를 사용하여 쿼리 수행 시간을 단축하고, 성능을 향상시킬 수 있습니다.
  42. 열(column): 열은 테이블(table)의 데이터를 구성하는 데이터 항목 중 하나입니다. 열은 데이터의 유형(type)과 이름(name)을 가지고 있으며, 데이터의 구조를 정의하는 역할을 합니다.
  43. 색인(index): 색인은 테이블(table)의 데이터를 빠르게 검색하기 위해 사용되는 자료구조입니다. 색인을 사용하여 쿼리 수행 시간을 최적화할 수 있습니다.
  44. 규칙(rule): 규칙은 데이터베이스 오브젝트에 대한 유효성 검사를 수행하는 오브젝트입니다. 규칙을 사용하여 데이터의 일관성과 무결성을 유지할 수 있습니다.
  45. 함수(function): 함수는 입력값을 받아서 연산을 수행하고, 결과값을 반환하는 오브젝트입니다. 함수를 사용하여 데이터 처리를 자동화하고, 쿼리 수행 시간을 최적화할 수 있습니다.

 

'IT > DB' 카테고리의 다른 글

sqllineage  (0) 2023.04.06
Open Source Database - Ranking  (0) 2023.04.06
Data Fabric 및 Data Mesh: 조직에 적합한 균형 찾기  (0) 2023.02.23
OpenMetadata  (0) 2022.10.20
Project Nessie  (0) 2022.10.20

댓글