[DB] 데이터베이스 기본 개념

유튜브에 있는 데이터베이스 강의를 통해 DB 기본을 다시 공부해보자.

 

쉬운 코드 데이터 베이스 기본 개념

데이터베이스관련 기본 개념을 이해하기 쉽게 설명해주는 영상

 

 

Database(DB)

전자적으로(electronically) 저장되고 사용되는 관련 있는(related) 데이터들의 조직화된 집합 (organized collection)

 

  • 전자적으로 : 컴퓨터를 이용하여 데이터를 저장 및 사용
  • 관련 있는 데이터 : 같은 서비스 안에서 생성되는 데이터들
  • 조직화된 집합 : 잘 정리되어 있는 데이터의 집합, 잘 정리되어 있으면 데이터도 빠르게 찾을 수 있고, 불 일치도 막을 수 있다.

 

사진: Unsplash 의 Gabriel Sollmann

DBMS (Database management systems)

사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 시스템

 

대표적인 DBMS은 PostgreSQL, MySQL, ORACLE, SQL Server가 있다.

 

metadata : dabase를 정의하거나 기술하는 data, 데이터를 설명하기 위한 데이터

  • catalog라고도 부른다.
  • 예시) 데이터 유형, 구조, 제약조건, 보안, 저장, 인덱스, 사용자 그룹 등등
  • metadata도 DBMS에 의해 저장/관리된다.

 

Database system

Database + DBMS + 연관된 application

Database system을 줄여서 database라고 부른다. 문맥에 따라 DB에 의미가 달라지니 잘 파악하자

 

Database System 흐름

  1. 유저, 프로그래머의 요청에 따라 application 프로그램이 DBMS에 쿼리를 보낸다.
  2. 쿼리 요청이 무엇인지 파악되면 요청 처리(쿼리 분석)
  3. 요청된 데이터가 어떤 형태로 되어 있는지 부가적인 정보를 확인 후 해당 정보를 바탕으로 실제 요청받은 정보를 찾아서 애플리케이션에 돌려준다.

 

Data models 

DB의 구조(structure)를 기술하는 데 사용될 수 있는 개념들이 모인 집합

  • DB 구조를 추상화해서 표현할 수 있는 수단 제공
  • data model은 여러 종류가 존재, 추상화 수준과 DB 구조화 방식이 각각 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작들도 포함

 

conceptual (or high-level) data model

  • 일반 사용자(비 개발자)들이 쉽게 이해할 수 있는 개념
  • 추상화 수준이 가장 높음
  • 비즈니스 요구사항을 추상화하여 기술
  • 대표적인 모델 : Entity Relationship model
    • 엔티티, 엔티티에 대한 속성, 엔티티 간의 관계를 설명

 

logical data model

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화할 수 있는 개념
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 한다.
  • 특정 DBMS에 종속되지 않는 수준에서 DB 구조화
  • 대표적인 모델 : relational data model (Oracle, MySQL , SQL Server)
    • object data model
    • object-relational data model (PostgreSQL)

 

physical data model

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지 기술
  • data format, data orderings, access path 등
    • access path : 데이터 검색을 빠르게 하기 위한 구조체 ex) index
  • 실제 저장되는 방법에 밀접하게 연관

 

schema & state

 

database schema

  • data model을 바탕으로 database의 구조를 기술(description) 한 것
  • schema는 database를 설계할 때 정해지며 한 번 정해진 후에는 자주 바뀌지 않는다.
  • 테이블 제목, 테이블 속성 등이 스키마라고 볼 수 있다. (데이터베이스의 구조)

 

database state

  • database에 있는 실세 데이터는 꽤 자주 바뀔 수 있다.
  • 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다.
  • 혹은 database에 있는 현재 instances의 집합이라고도 한다.
  • 특정 시점에 있는 데이터

 

three-schema architecture

  • database system을 구축하는 architecture 중의 하나
  • user application으로부터 물리적인 (physical) database를 분리시키는 목적
  • 세 가지 level이 존재하며 각각의 level 마다 schema가 정의되어 있다.
  • 안정적으로 database 운영하기 위한 목적
  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
  • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
  • 데이터가 존재하는 곳은 internal level

 

external schema (or user views) at external (or view) level

  • external views, user views라고도 불림
  • 특정 유저들이 필요로 하는 데이터만 표현
  • 그 외 알려줄 필요가 없는 데이터는 숨김
  • logical data model을 통해 표현

 

conceptual schema at conceptual level

  • 전체 database에 대한 구조를 기술
  • 물리적인 저장 구조에 관한 내용은 숨김
  • entities, data types, relationships, user operations, constraints에 집중
  • logical data model을 통해 기술

 

internal schema at internal level

  • 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
  • data storage, data structure, access path 등등 실체가 있는 내용 기술

 

database language

 

data definition language (DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음

 

storage definition language (SDL)

  • internal schema를 정의하는 용도로 사용되는 언어
  • 요즘은 특히 relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨

 

view definition language (VDL)

  • external schema를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
  • definition language로는 DDL이 다 커버한다.

 

data manipulation language (DML)

  • database에 있는 data를 활용하기 위한 언어
  • data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어

 

통합된 언어

  • DML , VDL , DDL 이 따로 존재하기보다는 통합된 언어로 존재한다.
  • 대표적인 예 : relational database language : SQL

 

 

문제

데이터베이스란 무엇인가?

 

DBMS란 무엇인가?

 

Database Sytem에 대해 설명해 보자

 

schema란?

 

PostgreSQL과 다른 RDBMS의 차이점은?