[데이터베이스기초] 2주차 - 데이터베이스 시스템

DKU/데이터베이스기초

[데이터베이스기초] 2주차 - 데이터베이스 시스템

ʕ민지ʔ 2022. 8. 29. 12:16

1. 데이터베이스의 역사

파일 시스템의 위기

컴퓨터 발전의 역사 = 데이터 처리의 발전사
EDPS (Electronic Data Processing System; 전자적 데이터 처리 시스템)
- 컴퓨터와 데이터 처리의 밀접한 관계를 보여준다
제1세대 컴퓨터 시스템
- 소프트웨어나 저장장치 등의 개발이 부족
- 주로 기술분야의 계산, 자료 분류 등에 사용
제2세대 컴퓨터 시스템
- 운영체제가 도입되고 고급 언어 개발
- 파일 시스템의 도입
- 자료를 분석하고 처리하는 일에 본격적으로 사용되기 시작
파일 시스템은 프로그램이 파일에 직접 접근해서 읽어오거나 이용했다. (파일을 이용한 데이터 처리)

파일 시스템의 문제점

데이터 종속성 (data dependency)
- 데이터를 사용하는 프로그램의 구조가 데이터 구조(파일 구조)의 영향을 받는다는 것을 의미
- 데이터 종속성은 프로그램의 개발과 유지 보수를 어렵게 한다
- ex) 학생정보 파일에서 필드의 순서를 바꾸어 저장하고자 하거나 학생의 이름을 저장하는 필드의 길이를 20자리에서 30자리로 늘리려는 경우 → 파일 구조에 대한 정보가 프로그램에 들어가 있기 때문에 데이터의 구조를 바꾸려면 프로그램도 고쳐야 한다는 문제점이 발생한다.
데이터 무결성 (data integrity)의 침해
- 데이터 무결성이란 저장된 데이터의 내용이 본래 의도했던 데이터의 형식, 범위를 준수해야 한다는 성질이다
- ex) 학생 정보 파일에서 나이 필드는 숫자 형식이어야 하고 음수가 아닌 양수여야 한다
- 과거의 정보시스템에서는 데이터 무결성을 지켜야 할 책임이 프로그래머에게 있음
- 정보화 사회에서는 인간의 삶의 많은 부분이 컴퓨터 시스템에 저장된 데이터에 의존하고 있기 때문에 데이터 무결성의 침해는 매우 심각한 문제이다.
데이터 중복성 (data redundancy)
- 같은 내용의 데이터가 여러 곳에 중복하여 저장되는 것을 의미한다.
- 과거의 정보시스템에서는 개별 부서나 응용 프로그램에서 필요로 하는 데이터 파일을 각각 만들어 사용하는 일이 많았음
- 저장 공간의 낭비 문제 발생
- 데이터의 불일치, 보안의 어려움과 같은 문제들이 발생
데이터 불일치 (data inconsistency)
- 중복 저장된 데이터들이 서로 일치하지 않는 것을 의미한다
- ex) 어떤 학생이 교무과에 휴학 신청을 하여 휴학을 했는데, 그 사실을 모르는 재무과에서는 등록금 고지서를 그 학생에게 발송. 교무과의 학생 정보와 재무과의 학생 정보가 각각 관리되면서 불일치가 발생함.
데이터 보안성(data security)의 결여
- 데이터가 저장되어 있는 파일은 그 내용이 텍스트 형식이나 잘 알려진 형식으로 저장되기 때문에 응용프로그램 없이도 쉽게 파일을 열어 내용을 볼 수가 있다.
- 파일의 공유를 위해 접근이 쉬운 위치에 파일을 저장했기 때문에 보안을 유지하기가 어려움
- 현대의 정보시스템에는 기업의 영업 비밀이나 고객의 사생활 정보와 같은 보안을 필요로 하는 데이터가 많이 저장되어 있기 때문에 보안성의 결여는 심각한 문제이다.
데이터 표준화 (data standardization)의 어려움
- 일정 규모 이상의 정보 시스템을 개발하기 위해서는 많은 수의 개발자들의 협력 작업 필요
- ex) 개발자 A는 학생 이름을 ‘S-NAME’, 길이는 20자리로, 개발자 B는 학생이름을 ‘NAME’, 15자리로 사용
- 표준화가 되어 있지 않으면 제 3자가 프로그램을 이해하기도 어렵고 두 응용프로그램 간의 호환성에도 문제
- 학생 이름을 지칭하고 표현하는 표준화된 규칙이 있다 하더라도 응용 프로그래머가 이를 지키지 않을 수 있음

데이터베이스의 등장

파일 시스템의 단점을 극복하면서도 다수의 사용자들이 정보를 공유할 수 있어야 한다는 요구에 따라 제안되었다.

데이터베이스의 철학
1. 파일 형태로 여기저기에 흩어져 있는 데이터, 정보들을 하나로 모아 관리
2. 사용자(응용 프로그램)와 데이터 사이에 인터페이스 역할을 할 수 있는 S/W를 제공

초기에는 계층형(hierarchical) 데이터베이스, 네트워크(network) 데이터베이스가 사용되었으나, 현재는 관계형(relational) 데이터베이스가 주류를 이루고 있다.

데이터베이스(database) : 모아놓은 데이터의 집합
데이터베이스 관리 시스템(DBMS; DataBase Management System) : 데이터를 관리하는 S/W

데이터베이스의 특징

기존 파일 시스템을 이용한 데이터 관리의 문제점을 해결하였다.

데이터 독립성(independency) 지원
- 사용자 혹은 응용 프로그램이 직접 데이터베이스에 접근할 수 없고 반드시 DBMS를 통해서만 접근이 가능하다.
- DBMS는 데이터베이스 내에 있는 데이터의 물리적, 논리적 변화가 응용 시스템에 영향을 미치지 않도록 함으로써 데이터 독립성을 보장한다.
데이터 무결성 유지
- DBMS가 무결성을 위반하는 데이터가 들어올 경우 처리를 거절함으로써 데이터의 무결성을 지원한다.
데이버 중복성 및 불일치 최소화
- 데이터베이스 내의 데이터는 한 개인의 관점이나 특정 부서의 관점에서 관리되는 것이 아니라, 데이터베이스를 공용하는 조직 전체의 관점에서 관리된다.
- 동일 데이터가 여러 부서에서 사용하는 경우 이를 하나로 관리함으로써 중복성을 방지한다.
데이터 표준화의 용이성
- 데이터베이스 관리자(DBA)가 설계과정을 주도함으로써 부서 간 이해를 조정하고 관리될 데이터를 표준화시킨다.
- 응용 프로그램에서 데이터에 접근하기 위해서는 DBMS가 가지고 있는 구조 정보에 따라야 하기 때문에 자연스럽게 표준화된다.
높은 데이터 보안성
- DBMS는 사용자의 권한에 따라 데이터베이스 내에 있는 데이터에 대한 접근을 제한할 수 있다.
- 저장된 데이터베이스는 일반적으로 DBMS를 통하지 않고는 외부에서 내용을 알아내기 매우 어렵다.
데이터 공유(data sharing)의 용이성
- 데이터베이스 시스템의 기본 철학은 데이터를 통합 관리하고 이를 여러 부서, 사용자들이 공유하도록 하는 것이다.
- DBMS는 여러 사용자의 요구를 동시적으로 처리할 수 있는 능력을 가지고 있다.
- DBMS는 데이터를 쉽게 이용할 수 있는 수단을 제공한다.

관계형 데이터베이스 (relational database) 모델

현재 가장 많이 사용되는 데이터베이스 모델이다.
데이터가 테이블 형태로 표현되며, 사용자가 데이터를 쉽게 다룰 수 있도록 해주는 질의어(SQL)를 제공한다.
테이블 형태로 표현된 데이터는 단순해서 누구나 쉽게 이해할 수 있다.
SQL은 자연어에 가까운 문법을 가지고 있어 배우기 쉽고, 데이터를 어떻게(how) 가져올 것인가 대신에 어떤(what) 데이터를 원하는지만 기술해주면 되기 때문에 사용자나 개발자의 입장에서는 데이터를 다루는 작업이 매우 단순해진다.
SQL 명령어나 문법은 표준화되어 있기 때문에 대부분의 명령어는 모든 관계형 데이터베이스 제품에서 공통적으로 사용이 가능하다.

관계형 DBMS 제품들

ORACLE (30%)
MySQL (25%)
Postgre SQL (19%)
SQL Server
SYBASE

비관계형 데이터베이스의 등장

관계형 데이터베이스는 테이블 형태의 정형화된 데이터의 저장 및 관리에 용이하다.
SNS, 문자 메시지, 이미지 데이터 등 비정형 데이터의 증대로 기존 관계형 데이터베이스로는 처리가 어려운 데이터들이 증가했다.
noSQL등장 : "Not Only SQL"
비관계형 DBMS 제품들 : Redis, HBASE, Cassandra, riak, mongoDB, CouchDB, Scalaris, Tokyo Cabinet, memvbase

2. 데이터베이스 시스템

컴퓨터를 사용하여 정보를 수집하고 분석하는데 데이터베이스 기술이 활용되고 있다.
정보와 데이터는 서로 다르다.

데이터베이스(database)의 정의

데이터베이스는 조직의 응용 시스템들이 공유해서 사용하는 운영 데이터(operational data; 현재 사용이 되고 있는)들이 구조적으로 통합된 모임이다.
데이터베이스의 구조는 사용되는 데이터 모델에 의해 결정된다.

데이터베이스의 예

대학에서는 데이터베이스에 학생들에 관하여 신상 정보, 수강 과목, 성적 등을 기록하고, 각 학과에 개설되어 있는 과목들에 관한 정보를 유지하고, 교수에 관해서 신상 정보, 담당 과목, 급여 정보를 유지한다.
항공기 예약 시스템에서는 여행사를 통해 항공기 좌석을 예약하면 모든 예약 정보가 데이터베이스에 기록된다.

데이터베이스의 특징

데이터베이스는 데이터의 대규모 저장소로서, 여러 부서에 속하는 여러 사용자에 의해 동시에 사용된다.
모든 데이터가 중복을 최소화하면서 통합된다.
데이터베이스는 한 조직체의 운영 데이터뿐만 아니라 그 데이터에 관한 설명(데이터베이스 스키마 또는 메타데이터)까지 포함한다.
프로그램과 데이터 간의 독립성이 제공된다.
효율적으로 접근이 가능하고 질의를 할 수 있다.
용어
- 데이터베이스 스키마 : 구조 정보
- 메타데이터(metadata) : 데이터에 대한 데이터
- 데이터 사전(data dictionary) : DBMS가 DB를 관리하기 위해 필요한 정보
- 시스템 카탈로그

데이터베이스 관리 시스템 (DBMS; Database Management System)

데이터베이스를 정의하고, 질의어를 지원하고, 리포트를 생성하는 등의 작업을 수행하는 소프트웨어
사용자가 새로운 데이터베이스를 생성하고
데이터베이스의 구조를 명시할 수 있게 하고
사용자가 데이터를 효율적으로 질의하고 수정할 수 있도록 하며
시스템의 고장이나 권한이 없는 사용자로부터 데이터를 안전하게 보호하며
동시에 여러 사용자가 데이터베이스를 접근하는 것을 제어하는 소프트웨어 패키지이다.
데이터베이스 언어라고 부르는 특별한 프로그래밍 언어를 한 개 이상 제공한다.
SQL은 여러 DBMS에서 제공되는 사실상의 표준 데이터베이스 언어이다.

데이터베이스 스키마 (schema)

전체적인 데이터베이스 구조를 뜻한다.
자주 변경되지는 않고, 데이터베이스의 모든 가능한 상태를 미리 정의한다.
내포(intension)라고 부른다.
구조 : 데이터를 넣을 수 있는 틀/껍데기 → 구조가 먼저 만들어져야 데이터를 넣을 수 있다.

데이터베이스 상태

특정 시점에서 데이터베이스의 내용을 의미하며, 시간이 지남에 따라 계속해서 바뀐다.
외연(extension)이라고 부른다.

데이터베이스 시스템(DBS; Database System)의 구성요소

무조건 DBMS를 통한다.

3. 관계형 데이터베이스

데이터 모델 (data model)

데이터베이스의 구조를 기술하는데 사용되는 개념들의 집합인 구조(데이터 타입과 관계), 이 구조 위에서 동작하는 연산자들, 무결성 제약 조건들로 이루어진다.
사용자들에게 데이터가 어떤 모양으로 저장되어 있다고 보이게 할 것인가?

계층형 데이터 모델

데이터링크로 연결되어 있다.
→ 데이터링크를 통해 빠르게 갈 수 있다. but 반드시 링크를 따라가야 한다.

네트워크 (network) 데이터 모델

링크를 조금 더 만들었다.

관계형 (relational) 데이터 모델

사용자에게 데이터가 테이블 형태로 관리된다고 보이게 한다. 링크가 없어져 더 유연해졌다. but 속도가 좀 떨어졌다.
장점
- 모델이 간단하여 이해하기가 쉽다.
- 사용자는 자신이 원하는 것(what)만 명시하고(→SQL 언어), 데이터가 어디에 있는지 어떻게 접근해야 하는지는 DBMS가 결정하기 때문에 편리하다.

4. DBMS 언어

데이터베이스에 접근하기 위해서는 DBMS와 커뮤니케이션이 필요하다.
사용자(사람, 프로그램)와 DBMS가 통신하기 위한 언어를 SQL(Structured Query Language)라고 한다.
SQL은 대표적인 비절차적 (non-procedural language) 언어이다.
SQL 명령어
- 데이터 정의어 : CREATE, DRO
- 데이터 조작어 : INSERT, UPDATE, DELETE
- 데이터 질의어 : SELECT

데이터 정의어 (DDL; Data Definition Language)

데이터베이스 스키마(구조)를 정의하는데 사용하는 명령어
데이터 정의어로 명시된 문장이 입력되면 DBMS는 사용자가 정의한 스키마에 대한 명세를 시스템 카탈로그 또는 데이터 사전에 저장한다.
데이터 정의어의 기본적인 기능
- 데이터 모델에서 지원하는 데이터 구조를 생성 (ex. CREATE TABLE)
- 데이터 구조의 변경 (ex. ALTER TABLE)
- 데이터 구조의 삭제 (ex. DROP TABLE)
- 데이터 접근을 위해 특정 속성(컬럼) 위에 인덱스를 정의 (ex. CREATE INDEX)

데이터 조작어 (DML; Data Manipulation Language)

데이터베이스 내의 원하는 데이터를 수정하고, 삽입하고, 삭제하는 명령어
INSERT, UPDATE, DELETE
대부분의 데이터 조작어는 SUM, COUNT, AVG와 같은 내장 함수들을 지원한다.
데이터 조작어/질의어는 단말기에서 대화식으로 입력되어 수행되거나, c, 코볼 등의 고급 프로그래밍 언어로 작성된 프로그램에 내포되어 사용될 수 있다. (embedded SQL)

데이터 질의어 (QL; Query Language)

데이터베이스 내의 원하는 데이터를 조회하는 명령어
SELECT
가장 많이 사용하는 명령어

5. 관계형 데이터베이스 용어

E.F.Codd가 정의한 것으로 오늘날 일반적으로 사용하는 용어와는 차이가 있다.

릴레이션 (relation)

테이블이라는 용어로 더 많이 사용한다.
관계형 데이터베이스에서 정보를 구분하여 저장하는 기본 단위
예시)
- STUDENT 릴레이션 : 학생에 관한 정보를 저장
- SUBJECT 릴레이션 : 과목에 대한 정보를 저장
동일한 데이터베이스 내에서는 같은 이름을 갖는 릴레이션은 존재할 수 없다.

속성 (attribute)

릴레이션에서 관리하는 구체적인 정보 항목에 해당하는 것이 속성이다.
현실세계의 개체 (예: 학생, 교수, 과목,..)들은 많은 속성들을 갖는데 그중에서 관리해야 할 필요가 있는 속성들만을 선택하여 릴레이션에 포함시킨다.
속성 역시 고유한 이름을 가지며 동일 릴레이션 내에서는 같은 이름의 속성이 존재할 수 없다. (단, 릴레이션이 다르면 상관없다.)

튜플 (tuple)

릴레이션이 현실세계의 어떤 개체를 표현한다면 튜플은 그 개체에 속한 구성원들 개개의 정보를 표현한다.
예) '학생'은 개체를 나타내는 이름이고
'김철수, '박선하', '안미희',.. 등은 '학생' 개체의 구성원이다.
한 릴레이션에 포함된 튜플의 개수는 시간에 따라 변할 수 있으며, 한 릴레이션은 적게는 수십 개 많게는 수십만 개의 튜플을 포함할 수 있다.

도메인 (domain)

도메인이란 릴레이션에 포함된 각각의 속성들이 가질 수 있는 값들의 집합이다.
도메인이라는 개념이 필요한 이유는 릴레이션에 저장되는 데이터 값들이 본래 의도했던 값들만 저장되고 관리되도록 하는데에 있다
예) '성별'이라는 소성이 있다면 이 속성이 가질 수 있는 값은 {남, 여}이다.
→ 데이터베이스 설계자는 성별의 도메인으로 'SEX'를 정의하고, 그 값으로 {남, 여}를 지정한 뒤, '성별'이라는 송성은 'SEX' 도메인에 있는 값만을 가질 수 있다고 지정해 놓으면 사용자들이 실수로 남, 여 이외의 값을 입력하는 것을 DBMS가 막을 수 있다.
현실적으로 도메인을 구현하는 것은 어렵기 때문에 대부분의 DBMS 제품에서는 사용자 정의 데이터 타입으로 사용한다. (이름이 같은 것은 도메인에 정의할 수 없기 때문이다.)
모든 속성은 도메인과 연결되어 있다.

E.F.Codd의 용어	File 시스템의 용어	자주 사용되는 용어
릴레이션 (relation)	파일 (file)	테이블 (table)
속성 (attribute)	필드 (field)	열 (column), 컬럼
튜플 (tuple)	레코드 (record)	행 (row)

현재글[데이터베이스기초] 2주차 - 데이터베이스 시스템

꾸준히

Today :
Yesterday :

꾸준히

[데이터베이스기초] 2주차 - 데이터베이스 시스템

1. 데이터베이스의 역사

파일 시스템의 위기

파일 시스템의 문제점

데이터베이스의 등장

데이터베이스의 특징

관계형 데이터베이스 (relational database) 모델

관계형 DBMS 제품들

비관계형 데이터베이스의 등장

2. 데이터베이스 시스템

데이터베이스(database)의 정의

데이터베이스의 예

데이터베이스의 특징

데이터베이스 관리 시스템 (DBMS; Database Management System)

데이터베이스 스키마 (schema)

데이터베이스 상태

데이터베이스 시스템(DBS; Database System)의 구성요소

3. 관계형 데이터베이스

데이터 모델 (data model)

계층형 데이터 모델

네트워크 (network) 데이터 모델

관계형 (relational) 데이터 모델

4. DBMS 언어

데이터 정의어 (DDL; Data Definition Language)

데이터 조작어 (DML; Data Manipulation Language)

데이터 질의어 (QL; Query Language)

5. 관계형 데이터베이스 용어

릴레이션 (relation)

속성 (attribute)

튜플 (tuple)

도메인 (domain)

'DKU/데이터베이스기초'의 다른글

티스토리툴바

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

[데이터베이스기초] 2주차 - 데이터베이스 시스템

1. 데이터베이스의 역사

파일 시스템의 위기

파일 시스템의 문제점

데이터베이스의 등장

데이터베이스의 특징

관계형 데이터베이스 (relational database) 모델

관계형 DBMS 제품들

비관계형 데이터베이스의 등장

2. 데이터베이스 시스템

데이터베이스(database)의 정의

데이터베이스의 예

데이터베이스의 특징

데이터베이스 관리 시스템 (DBMS; Database Management System)

데이터베이스 스키마 (schema)

데이터베이스 상태

데이터베이스 시스템(DBS; Database System)의 구성요소

3. 관계형 데이터베이스

데이터 모델 (data model)

계층형 데이터 모델

네트워크 (network) 데이터 모델

관계형 (relational) 데이터 모델

4. DBMS 언어

데이터 정의어 (DDL; Data Definition Language)

데이터 조작어 (DML; Data Manipulation Language)

데이터 질의어 (QL; Query Language)

5. 관계형 데이터베이스 용어

릴레이션 (relation)

속성 (attribute)

튜플 (tuple)

도메인 (domain)

'DKU/데이터베이스기초'의 다른글

관련글

티스토리툴바