SQLD 1과목 1-1장. 데이터 모델링의 이해

[목차]

1. 모델링이란?

2. 모델링의 특징

3. 모델링의 세 가지 관점

4. 데이터 모델링의 정의

5. 데이터 모델링의 목적

6. 데이터 모델이 제공하는 기능

7. 데이터 모델링의 중요성

8. 데이터 모델링의 유의점

9. 데이터 모델링의 3단계 진행

10. 프로젝트 생명주기에서 데이터 모델링

11. 데이터독립성의 이해

12. 데이터베이스의 3단계 구조

13. 데이터베이스 독립성 요소

14. 데이터베이스 사상

15. 데이터 모델링의 중요한 세 가지 개념

16. 데이터 모델링의 이해관계자

17. 데이터 모델의 표기법 ERD

18. ERD 작성 작업 순서

19. 좋은 데이터 모델의 요소

1. 모델링이란?

1) 살아가며 나타날 수 있는 다양한 현상은 사람, 사물, 개념 등에 의해 발생하며, 이것을 표기법에 의해 규칙을 가지고

표기하는 것 자체를 의미

2) 현실세계를 추상화, 단순화, 명확화하기 위해 일정한 표기법에 의해 표현하는 기법

2. 모델링의 특징

1) 추상화 : 현실세계를 일정 형식에 맞추어 표현한다는 의미로, 다양한 현상을 일정 양식인 표기법에 의해 표현하는 것

2) 단순화 : 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 하는 것

3) 명확화 : 누구나 이해하기 쉽게 하기 위해 대상에 대한 애매모호함을 제거하고 정확하게 현상을 기술하는 것

3. 모델링의 세 가지 관점

1) 데이터관점 : 업무가 어떤 데이터와 관련 있으며 데이터간의 관계는 무엇인가

2) 프로세스관점 : 업무가 실제 하고 있는 일은 무엇인가, 무엇을 해야 하는가

3) 데이터와 프로세스의 상관관점 : 업무가 처리하는 일의 방법에 따라 데이터는 어떻게 영향을 받는가

4. 데이터 모델링의 정의

1) 업무에서 필요로 하는 데이터를 시스템 구축 방법론에 의해 분석하고 설계하여 정보시스템을 구축하는 과정

2) 정보시스템을 구축하기 위한 데이터관점의 업무 분석 기법

3) 현실세계의 데이터에 대해 약속된 표기법에 의해 표현하는 과정

4) 데이터베이스를 구축하기 위한 분석/설계의 과정

5. 데이터 모델링의 목적

1) 업무정보를 구성하는 기초가 되는 정보들을 일정한 표기법에 의해 표현함으로써 정보시스템 구축의 대상이 되는 업

무 내용을 정확하게 분석하는 것

2) 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터관리에 사용하기 위함

6. 데이터 모델이 제공하는 기능

1) 시스템을 현재 또는 원하는 모습으로 가시화

2) 시스템의 구조와 행동을 명세화

3) 시스템을 구축하는 구조화된 틀을 제공

4) 시스템을 구축하는 과정에서 결정한 것을 문서화

5) 다양한 영역에 집중하기 위해 다른 영역의 세부 사항은 숨기는 다양한 관점

6) 목표에 따라 구체화된 상세 수준의 표현방법을 제공

7. 데이터 모델링의 중요성

1) 파급효과 : 데이터 모델의 변경이 불가피한 상황에서 다양한 영향 분석이 발생하기 때문에 전체 시스템 구축 프로젝트

에서 큰 위험요소

2) 복잡한 정보 요구사항의 간결한 표현 : 구축할 시스템의 정보 요구사항과 한계를 가장 명확하고 간결하게 표현할 수

있는 도구로서 건축물로 비유하면 설계 도면에 해당

3) 데이터 품질 : 데이터는 기간이 오래 될수록 활용가치가 높아지지만 내용이 그저 그렇거나 정확성이 떨어지면 소중한

비즈니스의 기회를 상실할 수 있는 문제

8. 데이터 모델링의 유의점

1) 중복

1] 데이터 모델은 같은 데이터를 사용하는 사람, 시간, 그리고 장소 파악에 도움이 되며, 여러 장소에 같은 정보를

저장 하지 않도록 주의

2) 비유연성

1] 데이터 모델을 어떻게 설계했는가에 따라 사소한 업무변화에도 데이터 모델이 수시로 변경되어 유지보수의 어려움

을 가중

2] 데이터의 정의를 데이터의 사용 프로세스와 분리하여 작은 변화가 애플리케이션과 데이터베이스에 중대한 변화를

일으킬 수 있는 가능성을 감소

3) 비일관성

1] 다른 데이터와 모순된다는 고려 없이 일련의 데이터를 수정하는 등 데이터의 중복이 없더라도 비일관성이 발생하기

때문에 데이터와 데이터간 상호 연관 관계에대한 명확한 정의로 이러한 위협을 사전에 예방

9. 데이터 모델링의 3단계 진행

1) 개념적 데이터 모델

1] 추상화 수준이 높고 업무중심적이며 포괄적인 수준의 모델링

2] 조직, 사용자의 데이터 욕구사항을 탐색, 분석하는데서 시작하며, 어떤 자료가 중요하고 유지되어야 하는지 결정하

는 것도 포함

3] 핵심 엔터티와 그들 간의 관계를 발견하고 그것을 표현하기 위해서 엔터티-관계 다이어그램을 생성하는 것

4] 사용자와 시스템 개바자가 데이터 요구 사항을 발견하는 것을 지원

5] 현 시스템이 어떻게 변형되어야 하는가를 이해하는데 유용

2) 논리적 데이터 모델

1] 업무의 구체적 모습과 흐름에 따른 구체화된 업무중심의 모델링

2] 데이터베이스 설계 프로세스의 input으로써 비즈니스 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법

3] 누가, 어떻게 그리고 전산화와는 별개로 비즈니스 데이터에 존재하는 사실들을 인식하여 기록하는 것

4] 시스템 구축을 위해 가장 먼저 시작할 기초적 업무조사를 하는 초기단계부터 해야 할 대부분의 사항을 모두 정의하

는 시스템 설계의 전 과정을 지원하는 '과정의 도구'

5] 논리 데이터 모델 상세화 과정의 대표적인 활동인 정규화는 논리 데이터 모델의 일관성을 확보하고 중복을 제거하

여 속성들이 가장 적절한 엔터티에 배치되도록 함으로써 보다 신뢰성있는 데이터 구조를 얻는게 목적

3) 물리적 데이터 모델

1] 데이터베이스의 저장구조에 따른 테이블스페이스 등을 고려한 모델링

2] 논리 데이터 모델이 데이터 저장소로서 어떻게 컴퓨터 하드웨어에 표현될 것인가를 다룸

3] 데이터가 물리적으로 컴퓨터에 어떻게 저장될 것인가에 대한 정의를 물리적 스키마라고 하며 물리적 저장구조와 사

용될 저장 장치, 자료를 추출하기 위해 사용될 접근 방법이 있음

4] 많은 시간이 투자

10. 프로젝트 생명주기에서 데이터 모델링

1) 일반적으로 계획/분석 단계에서 개념적 데이터 모델링, 분석단계에서 논리적 데이터 모델링, 설계단계에서 물리적 데

이터 모델링이 수행, 그러나 현실에서는 개념적 데이터 모델링을 대부분 생략

2) 정보공학, 구조적 방법론은 분석단계에서 논리적 데이터 모델을 수행하고 설계단계에서 물리적 데이터 모델을 수행

3) 나선형 모델(RUF)에서는 업무크기에 따라 논리, 물리적 데이터 모델을 분석, 설계단계 양쪽에서 수행하며 분석단계에

서는 논리적 데이터 모델이 더 많이 수행

11. 데이터 독립성의 이해

1) 어떤 단위에 대해 독립적인 의미를 부여하고 이를 효과적으로 구현하게 되면 자신이 가지는 고유한 특징을 명확히 하

고 다른 기능의 변경으로부터 쉽게 변경되지 않고 자신의 고유한 기능을 가지고 이를 제공하는 장점을 지님

2) 유지보수 비용 증가, 데이터 복잡도 증가, 데이터 중복성 증가, 요구사항 대응 저하로 인해 데이터독립성 필요성 증가

12. 데이터베이스 3단계 구조

1) 외부단계, 개념적 단계, 내부적 단계로 구성된 서로 간섭되지 않는 모델

2) 외부단계 : 사용자와 가장 가까운 단계로 사용자 개개인이 보는 자료에 대한 관점과 관련이 있는 구조데이터 유형의

공통적인 사항을 처리하는 통합된 뷰를 스키마 구조로 디자인한 형태

3) 외부스키마 : 개개 사용자가 보는 개인적 DB 스키마

4) 개념스키마 : 모든 사용자 관점을 통합한 조직 전체의 DB를 기술하는 것

5) 내부스키마 : 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 것

6) 요약

1] 데이터베이스 스키마 구조는 3단계로 구분되고 각각 상호 독립적 의미와 고유한 기능을 가짐

2] 데이터 모델링은 통합관점의 뷰를 가지고 있는 개념 스키마를 만들어가는 과정

13. 데이터베이스 독립성 요소

1) 논리적 독립성

1] 개념스키마가 변경되어도 외부 스키마에 영향을 미치지 않도록 지원

2] 논리적인 데이터독립성은 외부의 변경에도 개념스키마가 변하지 않는 특성을 지님

2] 논리적 구조가 변경되어도 응용 프로그램에 영향 없음

3] 사용자 특성에 맞는 변경이 가능하며 통합 구조 변경 가능

2) 물리적 독립성

1] 내부 스키마가 변경되어도 외부, 개념 스키마는 영향을 받지 않도록 지원하는 것

2] 저장장치의 구조변경은 응용프로그램과 개념 스키마에 영향 없음

3] 물리적 구조 영향 없이 개념구조 변경 가능하며, 개념구조 영향 없이 물리적 구조 변경가능

14. 데이터베이스 사상

1) 상호 독립적인 개념을 연결시켜주는 다리로, 논리적 사상과 물리적 사상이 존재

2) 논리적 사상

1] = 외부적/개념적 사상

2] 외부 화면과 사용자에게 인터페이스하기 위한 스키마 구조는 전체가 통합된 개념적 스키마와 연결되는 구조

3] 즉, 외부적 뷰와 개념적 뷰의 상호관련성

3) 물리적 사상

1] = 개념적/내부적 사상

2] 통합된 개념적 스키마 구조와 물리적으로 저장된 구조의 물리적인 테이블스페이스와 연결되는 구조

3] 즉, 개념적뷰와 저장된 데이터베이스의 상호관련성

4) 각 단계의 독립성을 보장하기 위해서 변경사항이 발생했을 때 DBA가 적절하게 작업을 해주기 때문에 독립성이 보장

15. 데이터 모델링의 중요한 세 가지 개념

1) 업무가 관여하는 어떤 것 : 사물이나 사건 등을 바라볼 때 전체를 지칭하는 용어

엔터티 = 집합, 인스턴스 = 단수

2) 어떤 것이 가지는 성격 : 어떤 것이 가지는 세부적인 사항

3) 업무가 관여하는 어떤 것 간의 관계 : 어떤 것이 다른 어떤 것과 가지는 연관성

16. 데이터 모델링의 이해관계자

1) 데이터 모델링은 단순히 데이터베이스를 설계한다는 측면보다 업무를 이해, 분석, 표현하는 등 다양한 과정을 포함하

며, 잘못된 데이터베이스 설계는 모든 트랜잭션에 영향을 미치기 때문에 이해관계자가 중요함

2) 정보시스템을 구축하는 모든 사람, 즉 IT기술자는 모두 데이터 모델링을 알아야 하며 정보화를 추진하는 위치에 있는

사람도 어느정도 파악하고 있어야 함

3) 이해관계자가 잘 배정되어 있으면 좋은 의사소통과 잘못된 업무 해석으로 인한 위험을 감소시킬 수 있음

4) DBA, 프로젝트 개발자, 전문 모델러, 현업 업무 전문가 등

17. 데이터 모델의 표기법 ERD

1) 각 업무분석에서 도출된 엔터티와 엔터티간의 관계를 이해하기 쉽게 도식화된 다이어그램으로 표시하는 방법

2) 업무에서 데이터의 흐름과 프로세스와의 연관성을 이야기하는 데 가장 중요한 표기법이자 산출물

3) 일정한 규칙으로 그림으로써 데이터 모델을 누구나 공통된 시각으로 파악하고 의사소통을 원활하게 하는 장점

4) 첸 표기법에서 엔터티는 사각형, 관계는 마름모, 속성은 타원형으로 표시

18. ERD 작성 작업 순서

1) 엔터티 그리기 및 배치

1] 가장 중요한 엔터티를 왼쪽상단에 배치

2] 1]을 중심으로 다른 엔터티를 나열하며 사람의 눈이 따라가기 편하도록 작성

3] 업무 흐름에 중심이 되는 엔터티는 타 엔터티와 많은 관계를 가지고 있기에 중앙에 배치

4] 업무를 진행하는 중심엔터티와 관계를 갖는 엔터티들은 중심에 배치된 엔터티 주위에 배치

2) 엔터티 간의 관계 설정

1] 초기에는 모두 Primaty key로 속성이 상속되는 식별자 관계를 설정

2] 중복되는 관계가 발생하지 않도록 하고 Cicle 관계도 발생하지 않도록 유의

3] 대부분의 관계는 엔터티의 성질과 주식별자를 보고 유추가 가능

3) 관계명 기술

1] 관계설정이 완료되면 연결된 관계에 관계이름을 부여

2] 현재형을 사용하고 지나치게 포괄적인 용어(이다, 가진다 등)는 미사용

4) 관계의 참여도 기술

1] 관계가 참여하는 성격 중 엔터티내에 인스턴스들이 얼마나 관계에 참여하는지를 나타내는 관계차수를 표현

2] 하나의 관계는 IE에서 실선, Barker에서는 점선과 실선을 혼합

5) 관계의 필수여부 기술

1] 다수참여는 까마귀발, 관계의 필수/선택은 관계선에 원을 표현

19. 좋은 데이터 모델의 요소

1) 완전성

1] 업무에서 필요로 하는 모든 데이터가 데이터 모델에 정의되어 있어야 함

2] 데이터 모델 검증에서 가장 먼저 확인해야 할 부분이며, 미충족 시 다른 평가 기준도 의미가 없음

2) 중복배제

1] 하나의 데이터베이스 내에 동일한 사실은 반드시 한 번만 기록

2] 데이터 중복 관리는 바람직하지 않은 형태의 데이터 관리비용을 지불

3) 업무규칙

1] 데이터 모델링 과정에서 도출, 규명되는 많은 업무규칙을 데이터 모델에 표현하고 사용자가 공유할 수 있도록 제공

2] 이를 통해 모든 사용자가 해당 규칙에 대해서 동일한 판단을 하고 데이터를 조작 가능

4) 데이터 재사용

1] 재사용성을 향상시키고자 한다면 데이터의 통합성과 독립성에 충분히 고려해야 함

2] 통합 모델이어야만 데이터 재사용성을 향상시킬 수 있음

3] 데이터가 애플리케이션에 대해 독립적으로 설계되어야만 데이터 재사용성을 향상시킬 수 있음

4] 구축하는 데이터 모델은 외부의 업무 환경 변화에 유연하게 대응할 수 있어야 함

5] 잘 정돈된 방법으로 테이터를 통합하여 데이터의 집합을 정의, 이를 데이터 모델로 잘 표현하여 활용하면 웬만한

업무 변화에도 데이터모델이 영향을 받지 않고 운용 가능

5) 의사소통

1] 데이터 모델은 정보시스템을 운용, 관리하는 많은 관련자들이 설계자가 정의한 업무 규칙들을 동일한 의미로 받아

들이고 정보시스템을 활용하게 하는 역할, 즉 의사소통의 도구로서 활용

6) 통합성

1] 바람직한 데이터 구조의 형태는 동일한 데이터를 조직 전체에서 한 번만 정의하고 여러 영역에서 참조, 활용하는 것

2] 동일한 성격의 데이터를 한 번만 정의하기 위해서는 공유 데이터에 대한 구조를 여러 업무 영역에서 공동으로 사용

하기 용이하게 정의할 수 있어야 함

'자격증 > SQLD' 카테고리의 다른 글

SQLD 1과목 2-1장. 성능데이터 모델링의 개요 (0)	2020.02.28
SQLD 1과목 1-5장. 식별자 (0)	2020.02.27
SQLD 1과목 1-4장. 관계 (0)	2020.02.27
SQLD 1과목 1-3장. 속성 (0)	2020.02.26
SQLD 1과목 1-2장. 엔터티 (0)	2020.02.20

IT 언어와 자격증

SQLD 1과목 1-1장. 데이터 모델링의 이해