[ Data Architecure Professional ]
3-1. 데이터 표준화 개요
3-1-1. 데이터 표준화 필요성
1. 데이터 관리 현황 및 개선 방안
가. 데이터 활용상의 문제점
- 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치 발생
데이터 표준 정책의 미비로 정보시스템 개발 및 운영 과정상에서 동일한 의미의 데이터를 다른 명칭으로 중복 관리하거나 동일한 명칭의 데이터를 시스템 간에 상이한 로직으로 산출하여 다른 의미로 활용
- 데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여
데이터 명칭, 데이터 정의에 대한 표준 미관리로 인해 새로운 정보 요건이나 정보요건변경 시 필요 데이터를 파악하는데 많은 시간을 낭비하여 정보 사용자에게 적시에 정확한 정보를 제공하는데 어려움
- 데이터 통합의 어려움
단위 시스템 위주의 데이터 표준을 적용하거나 적용하지 않는 경우도 존재하여 전사 데이터웨어하우스 구축 등 전사 데이터에 대한 통합적인 정보 요건을 기반으로 시스템을 구축할 때에는 데이터의 의미 파악 등에 많은 어려움이 있음
- 정보시스템 변경 및 유지 보수 곤란
데이터 표준 정책 미비로 인해 정보시스템의 변경이나 유지 보수 시 데이터 의미 파악에 어려움을 겪고 있고, 새로운 정보 요건 반영 시 기존 데이터의 활용이 가능한지 파악이 어려워 유지 보수에 많은 노력이 필요
나. 데이터 문제점의 원인
- 동시 다발적인 정보시스템 개발
최근의 정보시스템 개발프로젝트는 시스템 간 상호 연관성이 증대되어 단위 시스템 위주의 개발보다는 관련 정보시스템을 동시에 개발 환경하에서 전사적인 데이터 표준 정책 없이 단위 시스템 위주로 표준 정책을 수립하여 단위시스템의 업무 기능 구현에 초점을 맞추어 개발 프로젝트가 진행.
- 전사 데이터 관리 마인드 미형성
최근의 정보화 요건들은 단위 시스템의 데이터뿐 아니라 여러 시스템의 데이터를 복합적으로 활용하는 경우가 많으므로 전사 데이터를 체계적으로 관리하고자 하는 마인드 형성이 필요
- 전사 데이터 표준 관리 도구 부재
데이터 표준 관리에는 데이터 표준, 데이터 표준 준수 체크, 데이터 표준 조회 및 활용 등 많은 자동화된 시스템의 지원을 필요로 함. 정보 시스템개발 시에는 수작업으로 데이터 표준의 적용, 준수 체크 등을 수행하였지만 운영 단계에서 수작업에 가까운 표준 관리 방법은 많은 애로사항이 존재
다. 데이터 관리 개선 방안
- 데이터 표준화, 규격화를 위한 기본 방침 설정
- 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
- 전사적인 데이터 요소 등록 및 관리 체계구축
- 정보시스템 개발 및 유지 보수 시 승인된 데이터 요소를 활용함으로써 시스템 개발의 효율성 및 데이터 공유성 향상
2. 데이터 표준화 기대 효과
- 명칭의 통일로 인한 명확한 의사소통의 증대
동일한 데이터에 대해서는 동일한 명칭을 사용함으로써 개발자-현업, 운영자-현업, 운영자-운영자 등 다양한 계층간에 명확하고 신속한 의사소통이 가능
- 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
새로운 정보 요건 사항 발생 시 표준화된 데이터를 사용함으로써 데이터의 의미, 데이터의 위치 등을 신속하게 파악할 수 있어 정보 활용자에게 원하는 시기에 정확한 정보를 전달
- 일관된 데이터 형식 및 규칙의 적용
데이터 형식 및 규칙을 데이터 표준에 맞게 적용함으로써 데이터 입력 오류 방지를 통해 데이터의 품질을 향상시킬 수 있음. 또한 데이터의 활용에 있어 표준에 근거하여 활용함으로써 잘못된 데이터의 활용으로 인한 의사결정의 오류를 줄일 수 있음.
- 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
데이터 통합 프로젝트나 개별 시스템에서 다른 시스템의 데이터가 필요한 겨우 전사적으로 데이터 표준에 의해 데이터가 관리되고 있으면, 별도의 변환이나 정제 작업을 수행하지 않고 그대로 활용하면 되기 때문에 별도의 비용적인 부분이 발생하지 않음.
3-1-2. 데이터 표준화 개념
1. 데이터 표준화 정의
- 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미
- 이러한 데이터 표준화 작업은 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할을 수행
가. 데이터 명칭
- 유일성
- 업무적 관점의 보편성
- 의미 전달의 충분성
나. 데이터 정의
해당 데이터가 의미하는 범위 및 자격 요건을 규정
- 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제 3자의 입장에서 기술
- 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술
- 데이터 명칭을 그대로 서술하고나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않음
다. 데이터 형식
- 데이터 타입 : Numeric, Text, Date, Char, Timestamp 등
- 데이터 길이 및 소수점 자리
- 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일화
- 데이터의 최댓값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유있게 정의
- 특수 데이터 타입(CLOB, Long Raw)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 제약 사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않음
라. 데이터 규칙
발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 함. 데이터 규칙을 통해 데이터의 정합성 및 완전성을 향상시킬 수 있음
- 기본값 : 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터 값을 의미
- 허용값 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한하는 것으로, 표준 코드 중 데이터 항목별로 가질 수 없는 코드값을 사전에 정의하는 경우가 이에 해당됨
- 허용 범위 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한하는 경우
2. 데이터 표준화 구성 요소
가. 데이터 표준
데이터 표준화는 기본적으로 데이터 모델 및 데이터베이스에서 정의할 수 있는 모든 객체를 대상으로 수행하는 것이 이상적이지만 주로 관리해야 될 필요성이 있는 객체만을 대상으로 데이터 표준화를 하는 것이 효율적
- 표준용어
업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진
* 업무적 용어
데이터 표준화 작업은 주로 데이터베이스에 적용하고 사용할 객체에 국한되기 때문에 업무적 용어의 표준화가 반드시 필요한 것은 아님. 그러나 데이터베이스에서 적용할 용어들이 대부분 현업에서 사용하는 용어를 그대로 수용한다는 점을 고려할 때 업무적 용어의 표준화는 데이터 표준화 작업을 수월하게 해주는 장점을 가짐 Ex) 색인(INDEX)
* 기술적 용어
데이터 모델 또는 데이터베이스 스키마에서 나타나는 테이블명 및 칼럼명 등이 기술적 용어에 해당. 테이블 및 칼럼의 한글명은 대부분 업무적 용어를 그대로 수용하는 것이 이상적이지만, 데이터 베이스의 제약사항(테이블명의 중복 불허, 명칭에 대한 길이 제약)과 표준 단어의 사용에 따라 업무적 용어와는 상이하게 정의될 수 있음
- 표준 단어
* 표준 단어를 관리함으로써 동일한 개념을 의미하는 용어 (또는 표준 용어)의 생성을 예방.
* 표준 용어는 여문명 작성 기준이 됨. 즉, 테이블 및 칼럼의 한글명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정
- 표준 도메인
* 칼럼에 대항 성질을 그룹핑한 개념
* 도메인은 크게 문자형, 숫자형, 일자형, 시간형으로 분류할 수 있고, 더 세부적으로는 명, 주소, ID(이상 문자형), 금액, 율, 수량(이상숫자형) 등으로 분류할 수 있음
*표준 도메인을 칼럼에 적용함으로써 칼럼의 데이터 타입 및 데이터 길이를 일관되게 정의할 수 있음
- 표준 코드
* 도메인의 한 유형으로써 특정 도메인 값(코드 값)이 이미 정의되어 있는 도메인. 따라서 코드에 대한 표준은 다른 표준과는 달리 데이터 값, 즉 코드 값 까지 미리 정의해야함.
- 기타 데이터 표준 관련 요소
* 데이터 모델에서 정의하는 주제 영역, 관계명과 데이터베이스에서 정의하는 데이터베이스, 데이터베이스 스키마, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리
나. 데이터 표준 관리 조직
- 전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 데이터 관리자(DA, Data Administrator)의 역할이 요구됨
- 데이터 관리자는 하나의 기업 또는 조직 내에서 데이터에 대한 정의, 체계화, 감독 및 보안 업무를 담당하는 관리자를 의미
1) 데이터 관리자 주요 역할
* 데이터에 대한 정책과 표준 정의
* 부서 간 데이터 구조 조율
* 데이터 보안 관리
* 데이터 모델 관리
* 데이터의 효율적인 활용 방안 계획
2) 데이터 관리자 세부 역할
3) 데이터베이스 관리자와 비교
다. 데이터 표준화 절차
3-1-3. 데이터 표준화 관리 도구
1. 확장된 데이터 표준 관리 도구의 기능
- 데이터 표준 관리 기능 외에 애플리케이션 정보, 데이터 흐름 정보, 각종 데이터에 대한 메타(Meta)정보에 대한 조회 기능을 갖는 메타 데이터 시스템을 도입하여 활용 중
2. 데이터 표준 관리 시스템 기능
가. 데이터 표준 관리 기능
- 데이터 표준을 정의하고자 할 때, 기존 정의된 표준들을 조회하고, 이미 정의된 데이터 표준디 잘 준수되도록 관리하는 기능으로 구성됨
나. 데이터 구조 관리 기능
다. 프로세스 관리의 기능
- 데이터 표준에 대하여 신규 및 변경이 발생하거나 데이터 모델과 관련해 신규 테이블 등을 요청하고 승인하는 업무 프로세스 기능으로 구성
3. 데이터 표준 관리 시스템 도입 시 고려사항
- 확장성
다양한 시스템 및 DBMS의 정보 수집과 OLAP 툴 등의 다양한 데이터 구조 정보를 추출할 수 있는지 검토
- 유연성
데이터 표준을 전사적으로 일시에 적용하기는 곤란하므로 단계적 적용을 위한 여러개의 통합 표준을 사용할 수 있는 복수 표준 관리가 가능한지와 한글명 및 영문명의 표현방식, 표준의 변경 용이성을 검토
- 편의성
한글명의 영문명 자동 변환, 표준 검증의 주기적인 작업 수행 가능, 메타 정보 수집 시 Import 수작업 최소화 등 사용자 편의성을 검토
'[STUDY] DAP' 카테고리의 다른 글
[DAP] Ⅱ. 데이터 표준화 - 3-2. 데이터 표준화 수립 - (2) 데이터 표준화 정의 (0) | 2020.07.06 |
---|---|
[DAP] Ⅱ. 데이터 표준화 - 3-2. 데이터 표준화 수립 - (1) 데이터 표준화 원칙 정의 (0) | 2020.07.02 |
[DAP] Ⅱ. 데이터 요건 분석 - 2-4. 정보 요구사항 검증 (0) | 2020.06.30 |
[DAP] Ⅱ. 데이터 요건 분석 - 2-3. 정보 요구사항 분석 - (3) 정보 요구사항 확인 (0) | 2020.06.30 |
[DAP] Ⅱ. 데이터 요건 분석 - 2-3. 정보 요구사항 분석 - (2) 정보 요구사항 상세화 (0) | 2020.06.30 |