데이터 카탈로그

Data Catalog는 비즈니스 사용자들이 조직이 보유한 데이터와 프로세스에 대한 지식과 정보를 카탈로그 방식으로 이해할 수 있도록 지원하는 도구.

크든 작든 모든 데이터 거버넌스 출발은 데이터 가시성에 달려 있다. 데이터 관리자는 데이터가 어디에 있는지, 어디서 왔는지, 어떻게 사용되고 있는지, 그리고 누가 사용하는지를 확인할 필요가 있다. 데이터 거버넌스 프로그램을 실행할 때 이러한 가시성을 유지하는 것은 큰 도전이 될 수 있다. 이유는 간단하다 관리하는 데이터가 많을수록 추적하기가 더 어렵기 때문이다. 데이터 카탈로그는 이 문제를 해결할 수 있는 최적의 방안이고 최상의 데이터 카탈로그는 메타 데이터로부터 얻을 수 있다.

이를 활용하여, 사용자가 사용가능한 데이터 셋의 식별, 데이터 정의/동의어/핵심비즈니스 속성/ 사용방법 등의 메타데이터에 대한 투명성을 제공 (메타 데이터의 책임자/소유자 확인 가능)

→ 이러한 데이터 카탈로그는 데이터 리니지(Lineage)를 제공하여 데이터가 어떻게 활용되어 왔는지, 데이터 흐름과 의존관계를 파악할 수 있도록 도움을 준다.

Last updated