본문 바로가기
Biz/거버넌스

데이터 품질관리 모형 필요성

by 조병희 2020. 9. 29.

데이터 문제

데이터 관리의 체계화를 수행하기 위한 재정적 지원도 미비하고 기술적인 한계도 존재하여 투자의 우선 순위에서 밀리는 실정으로 데이터 사용에 있어 문제 제기나 불편한 제시부정적인 시각이 있다.

  • 정확하지 않아 신뢰할 수가 없다.
  • 정작 필요한 정보는 누락되어 있다.
  • 원하는 정보가 아니거나 원하는 형태가 아니다.
  • 제공 시점이 너무 느리다.
  • 어딘가 있을 것 같은데 요청하면 받아볼 수 없다.
  • 정보가 흘러 나가거나 일순간에 없어질 것 같아 불안하다.

잘못된 데이터나 부족한 데이터는 업무 수행에 지장을 줄 뿐만 아니라, 경우에 따라서는 심각한 결과를 초래한다. 특히 금전적인 데이터에 대한 오류는 조직에 막대한 손해를 끼칠 수도 있다.

관련 대상이 많고 복잡

시스템이 동시 다발적으로 개발되다 보니 데이터가 여러 시스템에 흩어지게 되고, 분산된 데이터의 일관성 유지에 어려움이 발생한다. 또한 데이터를 이용하는 사람이 많다 보니 잘못된 조작에 의한 데이터의 오류가 발생하기 쉽다. 최신의 상태로 갱신되어야 하지만, 갱신 작업에서 누락되는 경우도 발생하고, 데이터의 진정한 의미를 모르고 잘못 사용하여 엉뚱한 결과를 얻기도 한다. 애플리케이션은 한번 개발한 이후 요건의 변화가 발생하기 전까지는 고정적인 상태가 유지되지만, 데이터는 업무 처리에 따라 수시로 생성되고 변경되고 없어진다. 그러므로 세심한 관리가 필요한 대상이지만, 전산 분야 중에서는 상대적으로 관심이 적다.

데이터 품질관리를 통하여 데이터의 신뢰성이 확보되면, 자연스럽게 전산 시스템의 효율도 증가하게 될 것이다. 

데이터 품질 확보는 일시적인 투자나 관심에 의하여 급속히 이루어지는 것은 아니다. 데이터 전반에 대한 체계적이고 장기적인 정비가 이루어져야 한다. 또한 한번 확보된 품질도 관리를 소홀히 하면 순식간에 나빠질 수 있다. 데이터 품질은 확보하기도 어렵고 유지하기도 어렵다. 하지만 데이터 품질의 확보 없이는 전산의 활용이 위축될 것이고 조직의 경쟁력
도 저하될 것이므로, 가능한 모든 노력을 집중해야 할 과제라고 할 수 있다.

데이터 품질 확보의 어려움

1. 데이터 품질에 대한 인식은 개인적으로 차이가 존재하기 때문에, 모든 사람의 품질에 대한 기대를 충족시키는 것이 쉽지 않다. 

완벽한 수준의 품질 확보를 요구하는 개인이 있는가 하면 어느 정도의 오류는 인정하거나 특정 수준 이상을 유지하면 만족하는 경우도 있다. 한편 데이터 품질을 정의하는 데에도 많은 시각 차이가 있다. 데이터의 정확성을 품질로 생각하는 기본적인 수준에서부터, 데이터의 신속한 제공, 데이터 활용의 편의성 등을 품질로 생각하는 경우도 많다. 더 나아가 데이터의 안전성이나 보안성을 품질의 범주에 포함시키기도 한다. 데이터 품질을 확보하기 위한 출발점은 데이터 품질에 대한 정의를 공유하고, 현실적으로 달성가능한 품질 수준을 설정하는 것이다.

2. 품질에 영향을 미치는 요인들이 다양하고 이를 관리하기 위한 기능이 복잡하게 연결되어 있다는 것이다. 

그러다 보니 데이터 품질 확보를 위해서는 관련된 기능의 정비에 많은 노력을 들여야 한다. 예를 들어, 데이터 구조 관리, 데이터 흐름 관리, 데이터 표준 관리, 데이터 오너십 관리, 데이터 성능 관리 등이 데이터 품질과 직간접적으로 관련 있고, 이들 간에도 상호 복합적인 관계가 성립되어 있다. 그러므로 데이터 품질에 영향을 미치는 기능의 연관 관계를 명확하게 파악할 필요가 있다.

 

일반적인 접근의 문제점: 데이터 품질을 측정하고 품질 불량인 대상에 대한 개선을 수행

1. 품질 수준이 일정 수준 이상 밖에는 개선되지 않는다.

그 원인은 데이터 품질에 영향을 미치는 요인이 단지 겉으로 드러나는 현상에만 있는 것이 아니고, 데이터 관리 기능의 미흡이라는 근본적인 원인이 존재하기 때문이다. 그러므로 이러한 근본적인 원인을 해결하지 않고 품질을 특정 수준 이상으로 끌어 올리기 힘들다.

2. 품질 수준이 올라간 이후 일정 시간이 경과하면 품질이 다시 저하되는 경향이 많다.

데이터 품질관리는 지속적으로 수행되어야 효과를 얻을 수 있으며 일시적인 조치를 통해서 확보된 품질은 오래 지속되기 어렵다. 그러므로 데이터 품질과 관련이 있는 핵심 프로세스를 정비하고 유지하는 것이 중요하다. 

-> 데이터 품질 수준을 측정하는 것도 중요하지만, 데이터 품질을 관리하는 프로세스의 수준을 평가하고 이를 향상시키는 것이 근본적인 해결책이라고 할 수 있다.

 

10년 넘은 자료 (데이터품질관리성숙모형Ver[1]) 이지만 지금이나 그때나 전산이 개발/운영되면서 발생하는 내용은 유사한 듯하여 정리하여 본다.

 

댓글