유튜브에 있는 데이터베이스 강의를 통해 DB 기본을 다시 공부해보자.
Database(DB)
전자적으로(electronically) 저장되고 사용되는 관련 있는(related) 데이터들의 조직화된 집합 (organized collection)
- 전자적으로 : 컴퓨터를 이용하여 데이터를 저장 및 사용
- 관련 있는 데이터 : 같은 서비스 안에서 생성되는 데이터들
- 조직화된 집합 : 잘 정리되어 있는 데이터의 집합, 잘 정리되어 있으면 데이터도 빠르게 찾을 수 있고, 불 일치도 막을 수 있다.

DBMS (Database management systems)
사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템
대표적인 DBMS은 PostgreSQL, MySQL, ORACLE, SQL Server가 있다.
metadata : dabase를 정의하거나 기술하는 data, 데이터를 설명하기 위한 데이터
- catalog라고도 부른다.
- 예시) 데이터 유형, 구조, 제약조건, 보안, 저장, 인덱스, 사용자 그룹 등등
- metadata도 DBMS에 의해 저장/관리된다.
Database system
Database + DBMS + 연관된 application
Database system을 줄여서 database라고 부른다. 문맥에 따라 DB에 의미가 달라지니 잘 파악하자
Database System 흐름
- 유저, 프로그래머의 요청에 따라 application 프로그램이 DBMS에 쿼리를 보낸다.
- 쿼리 요청이 무엇인지 파악되면 요청 처리(쿼리 분석)
- 요청된 데이터가 어떤 형태로 되어 있는지 부가적인 정보를 확인 후 해당 정보를 바탕으로 실제 요청받은 정보를 찾아서 애플리케이션에 돌려준다.
Data models
DB의 구조(structure)를 기술하는 데 사용될 수 있는 개념들이 모인 집합
- DB 구조를 추상화해서 표현할 수 있는 수단 제공
- data model은 여러 종류가 존재, 추상화 수준과 DB 구조화 방식이 각각 다르다.
- DB에서 읽고 쓰기 위한 기본적인 동작들도 포함
conceptual (or high-level) data model
- 일반 사용자(비 개발자)들이 쉽게 이해할 수 있는 개념
- 추상화 수준이 가장 높음
- 비즈니스 요구사항을 추상화하여 기술
- 대표적인 모델 : Entity Relationship model
- 엔티티, 엔티티에 대한 속성, 엔티티 간의 관계를 설명
logical data model
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화할 수 있는 개념
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 한다.
- 특정 DBMS에 종속되지 않는 수준에서 DB 구조화
- 대표적인 모델 : relational data model (Oracle, MySQL , SQL Server)
- object data model
- object-relational data model (PostgreSQL)
physical data model
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지 기술
- data format, data orderings, access path 등
- access path : 데이터 검색을 빠르게 하기 위한 구조체 ex) index
- 실제 저장되는 방법에 밀접하게 연관
schema & state
database schema
- data model을 바탕으로 database의 구조를 기술(description) 한 것
- schema는 database를 설계할 때 정해지며 한 번 정해진 후에는 자주 바뀌지 않는다.
- 테이블 제목, 테이블 속성 등이 스키마라고 볼 수 있다. (데이터베이스의 구조)
database state
- database에 있는 실세 데이터는 꽤 자주 바뀔 수 있다.
- 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다.
- 혹은 database에 있는 현재 instances의 집합이라고도 한다.
- 특정 시점에 있는 데이터
three-schema architecture
- database system을 구축하는 architecture 중의 하나
- user application으로부터 물리적인 (physical) database를 분리시키는 목적
- 세 가지 level이 존재하며 각각의 level 마다 schema가 정의되어 있다.
- 안정적으로 database 운영하기 위한 목적
- 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
- 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
- 데이터가 존재하는 곳은 internal level
external schema (or user views) at external (or view) level
- external views, user views라고도 불림
- 특정 유저들이 필요로 하는 데이터만 표현
- 그 외 알려줄 필요가 없는 데이터는 숨김
- logical data model을 통해 표현
conceptual schema at conceptual level
- 전체 database에 대한 구조를 기술
- 물리적인 저장 구조에 관한 내용은 숨김
- entities, data types, relationships, user operations, constraints에 집중
- logical data model을 통해 기술
internal schema at internal level
- 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
- data storage, data structure, access path 등등 실체가 있는 내용 기술
database language
data definition language (DDL)
- conceptual schema를 정의하기 위해 사용되는 언어
- internal schema까지 정의할 수 있는 경우도 있음
storage definition language (SDL)
- internal schema를 정의하는 용도로 사용되는 언어
- 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨
view definition language (VDL)
- external schema를 정의하기 위해 사용되는 언어
- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
- definition language로는 DDL이 다 커버한다.
data manipulation language (DML)
- database에 있는 data를 활용하기 위한 언어
- data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어
통합된 언어
- DML , VDL , DDL 이 따로 존재하기보다는 통합된 언어로 존재한다.
- 대표적인 예 : relational database language : SQL
문제
데이터베이스란 무엇인가?
DBMS란 무엇인가?
Database Sytem에 대해 설명해 보자
schema란?
PostgreSQL과 다른 RDBMS의 차이점은?