제3절 데이터 표준 확정
1. 데이터 표준 검토
데이터 표준 검토는 데이터 관리자가 정의한 표준 단어 사전, 표준 도메인 사전, 표준 코드, 표준 용어 사전 등을 확인하고 해당 용어가 현재 사용되고 있는 용어로 정확하게 정의되어 있는지를 확인하고 승인 처리한다.
가. 데이터 표준 검토 계획 수립
데이터 표준 검토 대상이 되는 자료를 확인한다. 데이터 표준 검토 대상은 표준 단어 사전, 표준 도 메인 사전, 표준 코드 사전, 표준 용어 사전 등이 있다. 검토 기준은 전사 데이터 표준 기본 원칙 및 각 대상 별 데이터 표준 지침을 근거로 작성한다. 데이터 표준에 대한 주요 검증 기준은 다음과 같다.
- 유일성
각 데이터 표준이 물리적으로나 의미론적으로나 유일한지 확인한다.
예) 표준 단어 사전 내에서의 동음이의어 존재 여부, 용어 사전 내에서의 이음동의어 존재 여부
- 완전성
각 데이터 표준 대상별 필수 입력 사항들이 전부 정의되었는지 확인한다.
예) 표준 단어의 한글명과 영문 약어명
- 정확성
각 데이터 표준 대상별 입력 사항이 충실히 입력되었는지 확인한다.
예) 표준 용어의 정의
- 범용성
정의한 데이터 표준이 여러 정보시스템에서 적용이 가능한지 확인하고, 향후 개발할 각 정보시스템에 적용할 수 있도록 검토 계획을 수립해야 한다.
예) 표준 도메인의 데이터 타입에 대한 타당성
나. 데이터 표준 검토
-
검토 기준 및 검토 대상 산출물을 준비하고 검토에 참여할 대상자에게 배포한다.
-
검토 관련 장소, 시간, 준비 장비 등 검토를 실시하기 위한 제반 준비를 수행하며, 검토 담당자별로 검토 세션에서 수행해야 할 역할을 충분히 주지시킨다.
-
검토시 진행자는 제기되는 이슈에 대해서 참석자들간에 결론을 도출하기 위한 토론이 발생하지 않도록 이슈 목록으로 정리하고 검토가 정해진 일정 내에 마칠 수 있도록 주의를 기울여야 한다.
-
검토 세션이 종료되면 세션별로 그 결과를 정리한다. 검토 결과는 [그림 3-2-19]와 같은 양식에 정리한다
-
검토 결과가 정리되면 데이터 표준 대상별로 보완 사항을 작성한다. 보완 목록을 작성할 때는 검토 결과의 지적 사항만을 기록하는 것이 아니라 특정 내용이 변경됨으로써 함께 변경되어야 할 대상 도 함께 기록한다. 특히 표준 단어, 표준 도메인, 표준 코드에 대한 변경은 표준 용어에 영향을 미 치게 된다. 보완 목록은 [그림 3-2-20]과 같은 양식에 작성한다.

- [그림 3-2-19] 검토 결과서 예

- [그림 3-2-20] 보완 목록 예
다. 데이터 표준 보완 및 승인
-
보완 결과에 대해 확인 준비를 한다. 검토 결과, 보완 목록, 보완 사항이 반영된 데이터 표준을 준비하고 배포한다.
-
보완 목록에 준하여 데이터 표준 반영 여부를 확인한다. 반영되지 않은 사항 중 미반영 사유가 존재할 경우에는 미반영 사유가 타당성이 있는지를 검토하고 사유가 타당하지 못한 경우에는 보완 되도록 조치한다.
-
보안 목록에 있는 보완 사항이 모델에 모두 반영된 것을 확인하면 본 작업을 종료하고 전사 데이터 관리자의 승인을 득한다.
2. 데이터 표준 공표
데이터 표준 공표는 확정된 데이터 표준을 배포하여 전사 시스템에 적용 가능하도록 하며, 관련 내 역에 대한 이해 및 적용을 위한 교육 작업을 수행한다.
가. 데이터 표준 배포
검토가 종료되고 전사 데이터 관리자의 승인을 득한 데이터 표준은 데이터 표준 관리 도구에 등록 하여 전사의 모든 사용자가 데이터 표준을 조회할 수 있도록 조치하고, 정보시스템 개발 관련자들이 데이터 표준을 준수하여 개발할 것을 공지한다.
나. 데이터 표준 교육
데이터 표준에 대한 이해 및 효과적인 적용을 위해 사용자 및 운영자에 대한 교육 훈련 계획을 수립하고, 데이터 표준 지침 및 기타 데이터 표준 관련 교육 교재를 작성하고 교육을 수행한다.
장 요약
- 제1절 데이터 표준화 원칙 정의
- 현업 및 개발자로부터 데이터 표준과 관련된 요구 사항을 인터뷰 및 설문조사 등을 통해 조사한다.? 현행 정보시스템에서 적용하고 있는 데이터 표준 원칙 및 데이터 표준을 수집하여 현행 데이터 표준의 관리 대상 및 현황을 파악한다.
- 조사된 데이터 표준화 요구 사항과 현행 데이터 표준 관리 현황을 토대로 데이터 표준 대상별 문제점 및 개선 방안을 도출한다.
- 데이터 표준 개선 방안을 참고하여 전사 데이터 표준 기본 원칙을 정의하고 데이터 표준 대상별데이터 표준 지침을 작성한다.
- 데이터 표준 지침 작성 시 데이터 표준화 관련자의 역할과 책임에 대한 명시, 데이터 표준 대상별명명 규칙 정의, 데이터 형식에 대한 기준 정의 등을 포함한다.
- 주요 데이터 표준화 대상의 일반적인 지침의 예로는 한글명 및 영문명에 대한 허용 길이, 합성어에 대한 정의 지침, 동음이의어/이음동의어 허용 여부 및 처리 방안 등에 대하여 지침을 정의한다.
- 적용 DBMS별 특성을 감안하여 타 DBMS에서 적용이 불가능한 상황이 발생하지 않도록 주의한다.
- 제2절 데이터 표준 정의
- 표준 단어 사전을 작성하기 위해서는 기존 데이터 모델 및 업무 용어가 사용하고 있는 모든 단어들을 수집하고 정련을 통해 작성한다.
- 표준 단어란 문법상 일정한 뜻과 구실을 가지는 말의 최소 단위를 의미하며 기업에서 업무상 사용하며 일정한 의미를 갖는다.
- 표준 단어 사전 작성 시 동음이의어와 이음동의어에 주의한다.
- 표준 단어 사전 작성 시 접두어 및 접미어 처리에 대한 원칙을 수립하여 혼동을 방지해야 한다.
- 표준 도메인은 전사적으로 사용하고 있는 데이터를 유사한 그룹으로 나누어 동일한 유형과 길이를 정의하기 위한 방안이다.
- 하나의 도메인은 여러 개의 하위 도메인을 가질 수 있다.
- 하나의 데이터 항목은 복수 개의 도메인을 지정할 수 없고, 반드시 하나의 도메인을 지정해야 한다.
- 어느 도메인에도 속하지 않는 항목이 있을 수 있기 때문에 모든 용어를 전부 만족하는 도메인을만들 필요는 없다.
- 표준 코드를 정의하기 위해서는 개별 시스템에서 관리되는 현행의 코드 값을 조사하여 작업한다.
- 표준 코드는 업무 범위에서 가능한 한 유일하게 정의를 해야 데이터의 중복 및 불일치성을 방지할수 있다.
- 코드를 관리하는 방법으로는 단독 코드 테이블로 관리하는 방법, 전체를 하나의 테이블에 통합하여 관리하는 방법, 해당 애플리케이션 내부에서 관리하는 방법 등이 있다.
- 가능한 한 전체 코드를 하나의 테이블에서 통합 관리하는 것이 좀 더 효율적일 수 있다. 신규 정의및 변경에 대응하기가 쉽다.
- 특정 데이터 항목이 사용되는 코드 값을 조사하여 허용 값 및 허용 범위에 대한 정확성 여부를 검토한다.
- 코드 통합 시에는 가능한 한 기존 코드를 기준으로 통합을 하며, 너무 무리한 통합으로 의미의 이해나 사용에 무리가 되지 않도록 한다.
- 일부 업무에서 특정 코드의 전체를 사용하지 않고 범위를 한정하여 사용하는 경우 별도의 파생 코드를 생성하여 사용하도록 하고, 이때는 반드시 표준 코드에서 정의된 값을 사용하도록 한다.
- 표준 용어 사전은 업무에서 자주 사용하는 용어를 조합하여 사용하도록 한다.
- 표준 용어를 작성할 때는 너무 지나친 약어를 사용해서 업무에 대한 이해도가 떨어지지 않도록 주의한다.
- 정의된 표준 용어가 너무 길다면 두 개의 표준 용어로 분할하거나 복합 용어의 생성을 검토한다.
- 제3절 데이터 표준 확정
- 정의된 데이터 표준들이 업무적으로나 의미적으로 유일한지, 필수 입력 사항은 전부 정의되었는지, 전사 정보시스템에서 사용하기에 적합한지를 검토한다.
- 데이터 표준에 대한 검토 계획을 수립하여 관련자의 검토를 받도록 한다.
- 검토 시 지적된 사항에 대한 보완 사항이 반영되었는지, 되지 않았다면 구체적인 사유가 무엇인지를 파악한다.
- 최종 확정된 데이터 표준을 배포하여 전사 시스템에 적용 가능하도록 데이터 표준 관리 도구에 등록하고, 데이터 표준에 대한 이해 및 효과적인 적용을 위해 교육 작업을 수행한다.
연습문제
문제 1. A 데이터 형식은 데이터 표현 형태 정의를 통해 데이터 입력 오류와 통제 위험을 최소화하는 역할을 하고 업무 규칙 및 사용 목적과 일관되도록 한다. 다음 중 전사 차원의 데이터 표준을 정의할 때 데이터 형식의 데이터 타입으로 부적절한 것은?
- ① Char
- ② Date
- ③ Numeric
- ④ Long Raw
특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등을 수행하는데 제약사항이많이 존재하기 때문에 표준 데이터 타입으로 적절하지 않다.
문제 2. 칼럼(Column)에 대한 성질을 그룹핑한 개념으로 문자형, 숫자형, 일자형, 시간형으로 분류할 수 있는데, 다음 중 동일한 형식을 부여하기 위해 사용하는 표준화 요소로 적절한 것은?
- ① 표준 용어
- ② 표준 코드
- ③ 도메인 유형
- ④ 표준 도메인
도메인 유형은 표준 도메인의 상위 개념으로 칼럼에 적용하고자 정의하기 보다는 표준 도메인의유형을 효과적으로 분류하기 위해 정의한다. 따라서 칼럼에 동일한 형식을 부여하기 위해 사용하는 표준화는 도메인이다.
문제 3. 표준 용어를 만드는 과정이나 만들어진 이후 변경이 되면 파급 효과가 크기 때문에 현행에서 사용하고 있는 용어들에 대한 면밀한 분석을 통하여 표준 용어를 생성하여야 한다. 다음 중 표준 용어의 생성 과정이나 표준 용어의 변경에 있어 직접적인 영향으로 거리가 먼 것은?
- ① 표준 단어
- ② 표준 도메인
- ③ 표준 코드값
- ④ 기존 업무 용어
표준 용어는 기존 업무 용어를 토대로 하여 표준 단어 사전에 등록된 관련 표준 단어의 조합으로구성하며 속성과 관련된 용어일 경우에는 표준 도메인을 적용하여 데이터 형식을 부여할 수 있다.그러나 표준 코드의 코드값은 일종의 데이터 값이기 때문에 아무런 상관이 없다.
문제 4. Y지역본부 대출담당인 C씨는 데이터아키텍처(Data Architecture) 담당자인 K대리에게 불편 사항을 설명했다. 그 내용은 C씨가 신규로 심사하는 신규고객의 95% 이상이 국내 직장에 근무하는 일반 급여 생활자였다. 그래서 고객평점 항목 입력 화면에서 ‘해외자동차보유여부’ 항목의 값으로 ‘아니오’ 라고 선택하는 경우가 빈번했다. 이에 C사원은 화면에서 어떠한 값의 입력도 없는 경우 ‘아니오’ 라고 미리 정의된 값이 입력되도록 요청했다. 다음 중 이 요청 사항을 해결하기 위해 사용할 수 있는 설정으로 적합한 것은?
- ① 코드 허용 범위 설정
- ② 코드 허용값 설정
- ③ 코드 인스턴스 설정
- ④ 기본 값 설정
기본값을 사전에 정의함으로써 사용자가 별도의 값을 입력하지 않은 경우에 정의된 기본값이 적용되어 사용자의 불편함을 덜어주고, 아울러 데이터 표준화 및 품질차원에서 효과를 얻을 수 있다.
문제 5. 데이터 관리자(Data Administrator)는 현행 시스템에서 사용하는 수많은 용어들을 분석하여 표준 단어를 생성한 뒤, 별도의 리뷰(Review) 과정을 통해 표준 단어에 대한 정련을 진행하였다. 다음 중 리뷰 과정에서 별도의 의견 없이 통과된 표준 단어로 적합한 것은?
- ① 고객계좌번호
- ② 입력자사원번호
- ③ 최종학력코드
- ④ 주소
표준 단어란 가장 작은 최소단위를 의미한다. 고객 계좌번호는 표준 용어 정도에 해당되며, 이를표준 단어로 분리 시에는 고객, 계좌번호 등과 같이 분리될 수 있다.