슈개's IT/Engineer Room

[합격본] 정보처리기사 실기 데이터베이스 기출 키워드 정리

슈개 2021. 1. 29. 11:08
반응형

정보처리기사 실기 데이터베이스 기출 키워드 정리

 

2019년 정처기 실기 합격한 정리본입니다.

참고하시면 좋겠습니다^^

 

통합데이터, 저장데이터, 운영 데이터, 공용데이터

데이터베이스의 정의
4가지를 서술하시오(영어 암기 포함)

OO 데이터

실시간 접근성, 계속적인 변화, 동시 공용, 내용에 의한 참조

데이터베이스의 특성
4가지를 서술하시오(영어 암기 포함)

 

DBMS

응용프로그램과 데이터의 중재자인 시스템은?

데이터 중복 최소화, 공유성, 일관성, 무결성, 보안 유지

 

 

DBMS의 특징?
데이터 중복 최소화
공유성
일관성
무결성
보안 유지

 

사용자

데이터의 검색, 삭제, 갱신 작업 등의 목적으로 응용프로그램으로 DB에 접근하는 사람은?

 

응용 프로그래머

프로그래밍 언어와 데이터 조작어로 응용 프로그램을 작성하여 DB에 접근하는 사람은?

 

DBA

데이터베이스 전반에 책임을 갖는 사람

 

DA, Data Architect

데이터의 구조를 체계적으로 정의하는 사람은?

 

DA, Data Administrator

데이터 관리를 총괄하는 사람은?

 

외부스키마, External Schema

여러개의 OO 스키마가 존재, 서브스키마, 사용자 뷰 라고도 한다

 

개념 스키마, Conceptual Schema

1. 전체적인 논리적인 구조
2. 개체 간의 제약조건을 가짐
3. 단순히 스키마라고도 함

 

내부 스키마, Internal Schema

1. 물리적 저장장치 입장에서 DB구조를 정의
2. 레코드의 형식을 정의
3. 저장 스키마(Storage Schema)

 

row, Tuple, Record

릴레이션 구조에서 행에 관련된 단어 3가지

 

column, Attribute, 속성, Item, Field

릴레이션 구조에서 열에 관련된 단어 5가지

c
A

I
F

 

카디널리티, Cardinality

Tuple의 수(속성 라인 제외)는 뭐다?

 

차수, Degree

속성(Attribute)의 수는 뭐다?

 

도메인, Domain

하나의 속성이 갖는 원자값들의 집합은?

 

릴레이션 스키마

릴레이션의 속성 라인을 뭐라고 부를까?
OOOO OOO

------------------------
학과 | 이름 | 주번 | <- ??
-------------------------

 

릴레이션 인스턴스

릴레이션의 Tuple 라인을 뭐라고 부를까?
OOOO OOOO

------------------------
학과 | 이름 | 주번 |
-------------------------
| 해킹 | kkk | 1114 | <- ??

 

사상, Mapping Rule

ER 스키마를 관계 스키마로 뭘 한다?

 

{ | (기본키, 대체키) 후보키 | 슈퍼키}

키(key)에 대한 전체 맵을 그려보기

 

슈퍼키, Super Key

유일성O, 최소성X는 키는?

 

후보키, Candidate Key

유일성O, 최소성O 키는?

 

기본키, Primary Key

중복값이나 널값을 가질 수 없는 키는?

 

대체키, Alternate Key

기본키를 제외한 나머지 후보키는?

 

외래키, Foreign Key

다른 릴레이션을 참조하는 키는?

 

무결성

DB의 저장된 값과 실제 세계의 값이 일치하는 정확성이 무엇인가?

 

개체 무결성 제약

기본키를 구성하는 어떠한 속성값도 널값! 중복값! 가지면 안되는 제약은?

 

참조 무결성 제약

[ 릴레이션 R1 ]이 [ 릴레이션 R2 ]의 튜플을 참조할 때,

참조할 놈이, 반드시 R2에 존재해야 한다.

 

Restrict, 제한, No Action

자식테이블에 데이터 존재 시, 부모테이블 삭제/수정 안함

 

Cascade, 연쇄

테이블 삭제시 참조하고 있는 다른 테이블도 삭제한다.

 

SET NULL

참조되는 자식테이블의 외래키 값을

SET NULL

도메인 무결성

주어진 속성값이, 정의된 도메인에 속한 값이어야 한다.

무슨 무결성 법칙인가?

 

이상, Anomaly

데이터 중복으로 테이블 조작 시 불일치가 발생하는 현상은?

 

삽입 이상

[이상현상]
불필요한 데이터가 같이 삽입되어야 하고, 안그러면 삽입되지 않는 현상이다.

 

 

삭제 이상

[이상현상]
튜플 삭제 시 다른 값도 연쇄로 삭제되는 현상이다.

 

 

갱신 이상

[이상현상]

갱신할때 중복데이터 일부만 갱신되어 정보에 모순이 발생하는 현상이다.

 

완전함수종속(2NF)

부분!함수적!종속!을 제거하면 무엇이 되지?
-> OO 함수 종속

학번|과목코드 → 학과 (OO함수종속)
학번 → 학과 (부분함수적종속)

이건 몇 정규화 과정에서 실행되지?

 

결정자(X), 종속자(Y)

X → Y
( 1 ) ( 2 )
X는 Y를 OO 한다.
Y는 X에 OO 한다.

 

다치 종속(4NF)

X →> B
여러개의 B의 값을 갖는다

몇 정규형과, 무슨 종속일까요?

 

이행적 함수 종속(3NF)

A → B, B → C 일때,
A → C를 만족하는 관계를 무슨 함수 종속 이라고 하는가?

몇 정규형일까요?

 

조인 종속(5NF)

5정규형은 무슨 종속?

 

정규화

무슨 과정일까?

1. 테이블을 쪼개는 과정
2. 효율적으로 DB를 구축하기 위함
3. 이상 현상과 같은 문제점을 해결하기 위함

 

삽입, 삭제, 갱신

이상 현상의 종류 3가지는?


1. 삽입할때 같이 삽입해야 한다. 안그러면 삽입되지 않는다.
2. 삭세 시, 다른 값도 연쇄 삭제가 되는 것
3. 갱신 할때 ,다른 값도 갱신되어 정보 모순이 발생하는 것

 

1NF

도메인이 원자값이어야 한다

 

2NF

부분 함수 종속을 제거한다.

 

3NF

이행적 함수 종속을 제거한다.

 

BCNF

결정자이면서 후보키가 아닌 것 제거

 

4NF

다치 종속 제거

 

5NF

조인 종속성 이용

 

요구조건 분석, 개념적 설계, 논리적 설계, 물리적 설계, 구현

데이터베이스 설계 과정을 순서대로 나열하시오.

5개 단계 (요 개논물 구)

 

역정규화, 반정규화, De-normalization

정규화된 테이블의 기존 설계를 재구성 한다.

1. 시스템 성능향상을 위함
2. 개발과 운영을 단순화하기 위함

트랜잭션 처리도 분석 -> 사용량 많은 것 추출 -> 성능영향

 

CRUD matrix

Create, Read, Update, Delete 4가지 유형으로 업무가 진행되는 절차에 따른 데이터 상관관계를 분석 하는 것은?

 

View, 뷰

DB 사용자들이 접근하는 테이블로, 가상 테이블이다.

1. 데이터 보안 유지
2. 구조 단순화
3. 데이터 독립성 제공

 

인덱스

DB에서 원하는 데이터를 빨리 가져오기 위해 "데이터 위치 정보"를 모아놓은 개체

항상 정렬되어 있는 상태로 유지된다.

 

FTS, Full Table Scan

1. Index 중 하나로 테이블에 존재하는 모든 데이터를 처음부터 끝까지 조회하면서 결과를 검색하는 것.

2. 대량의 데이터 조회 시, 성능이 떨어짐

 

클러스터드 인덱스, Clustered INDEX

[INDEX의 종류 문제]

1. 물리적으로 정렬한다.
2. 검색속도가 빠르며, 범위 조회에 좋다
3. 한 테이블에 "하나"의 OO만 생성 가능하다.
4. 기본키를 기반으로 OO 인덱스를 만든다.

 

넌 클러스터드 인덱스, Non-Clustered INDEX

[INDEX의 종류 문제]

1. 인덱스만 정렬함, 물리적으로 정렬X
2. 인덱스를 여러개 만들 수 있다.
3. clustered Index보다 느림

 

선택성

선택될 수 있는 빈도를 의미하는 것은?

(남, 여)와 같은 선택 가능한 빈도가 낮으면 인덱스를 지정하지 않은 것이 좋음

 

ㅇㅇ

[관계 데이터 연산]
1. 관계 대수(절차적)
- 어떻게 연산해야 내가 원하는 값을 가져오지?
- ♥ 일반 집합 연산자
♥ 합집합 U, 교집합∩ , 차집합 - , 카티션 프로덕트 X


- 순수 관계 연산자
2. 관계 해석(비절차적)
- 내가 추출할 데이터가 뭘까?
- 튜플 관계해석
- 도메인 관계해석


정답 ㅇㅇ

 

select, 시그마, σ

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

튜플(행)의 수평적 부분 집합을 구하는 연산자와 기호는?

--------------------------
|_____|

 

select, project, join, division

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자 종류는??? ♥

나는 순수해~ SPJD

 

σ학과='컴퓨터' (학생)

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자 σ
Selection 시그마

Select *
from 학생
where 학과= '컴퓨터' --> 조건 관련

경우 표기 방식은?

 

π 학번,성명(학생)

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

속성(열)의 수직적 부분 집합을 구하는 연산자와 기호는?


Select 학번, 성명 --> 속성 관련
from 학생;

Projection 파이

------------
| |
| |
| |
| |
| |
| |
| |
| |
| |

 

 

 

 

 

 

 

JOIN, ▷◁

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

공통 속성을 중심으로 두개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 생성하는 연산과 기호는?

▷◁

 

A ▷◁ A속성=S속성 S

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

공통 속성을 중심으로 두개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 생성하는 연산과 기호는?

A, B 릴레이션에 대한 JOIN 표기형식은?

 

세타 조인

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

<, >, = 등의 비교 연산자를 Theta로 표현하여 나타낸 조인은?

 

division, 나누기 기호

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

A, B 릴레이션이 있다.

나눠서 B 릴레이션 내용을 포함한 것을 결과 릴레이션 하는 연산과 기호는?

 

자연 조인

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

일반적인 JOIN은 'OO 조인' 임
동일 조인에서 중복된 동일 속성값을 제거한 조인은?

 

A A속성÷ B속성 B

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서

A, B 릴레이션이 있다.
A ÷ B = B 내용 포함하여 추출

표기 형식은?

 

동일 조인, 동등 조인

[관계 데이터 연산]
1. 관계 대수(절차적)
- 일반 집합 연산자
- ♥ 순수 관계 연산자에서


세타가 '='인 조인을 OO 조인이라고 한다?

 

메타데이터

데이터의 데이터?

 

시스템 카탈로그

DB에서 '데이터 사전'으로도 불리는 이것은?

DB에서 다양한 데이터 객체에 대한 정보를 유지 관리하기 위한 시스템

 

Create, alter, drop

SQL의 DDL 종류는?

Data Define language

카드를 정의하다.

 

ㅇㅇ

[SQL의 DDL 종류]
Create, Alter, Drop
명령문 직접 써보기

정답: ㅇㅇ

 

GRANT, REVOKE, COMMIT, Rollback

SQL의 DCL 종류는?

Data Control language

컨트롤 하다.

G 그랜드 파~
R 리보크 메이커 좋아해~
C 매장으로 커밋 커밋~
R 롤백~ 먹으면서

 

...

[SQL의 DCL 종류]
GRANT, REVOKE --> 명령문 직접 써보기
COMMIT, Rollback

정답: ㅇㅇ

 

select, insert, delete, update

[SQL의 DML 종류]

S
I
D
U

 

...

[SQL의 DCL 종류]
select, insert, delete, update --> 명령문 직접 써보기

정답: ㅇㅇ

 

트리거, Trigger

[데이터베이스 고급 기능]

1. 테이블에 데이터 수정 시, 다른 테이블도 연쇄적으로 수정되는 목적으로 쓰는 것은?
2. 데이터 무결성, 일관성을 유지 할 수 있음
3. 프로그래머가 모든 업무를 숙지하지 않아도 처리가 되서 안정적으로 수행할 수 있음

 

내장형 SQL, Embedded SQL

1. 응용 프로그램 내 SQL문장이 들어가 있음
2. 프로그램 실행 시 함께 SQL 실행
3. 변수에 하나의 튜플만 담을 수 있는 단점

C언어 안에 SQL 문장 들어 있음

 

커서, Cursor

OO은 내장형 SQL과 달리 복수 개의 튜플에 접근 가능하다.

1. 레코드 집합을 처리하기 위한 일종의 포인터
2. 포인터로, 레코드 전체 처리할 수 있음

[명령어]
Declare 커서 선언
Open 커서 실행
Fetch 값 load
Close 커서 닫음

 

스토어드 프로시저, Stored Procedure

1. 연속된 SQL 문장을 하나로 모아 따로 저장함
2. 필요할때 가져다가 씀
3. 모듈화로 재사용에 용이

 

commit, rollback

하나의 트랜잭션은 OO 되거나, OO 되어야한다.

 

트랜잭션, Transaction

DB에서 하나의 작업을 처리하기 위한 연산의 집합은?

 

ㅇㅇ

[트랜잭션의 특성 ACID]

종류 4가지를 적으시오

독립일은 영원 하라~
립 관 속자
성 성 성성

정답 OO

 

원자성, Atomicity, Atom i ci ty, 아톰 이 시 끼

[트랜잭션의 특성 ACID] - 영어도 암기

1. 트랜잭션 연산이
모두 반영되거나, 전혀 반영되지 않아야 함

2. 연산이 ALL 실행되거나 Nothing 실행되어야 한다.

 

일관성, Consistency

[트랜잭션의 특성 ACID] - 영어도 암기

1. 트랜잭션 수행 전과 수행 완료 후의 상태가 같아야 한다.
2. 실행 완료후에 일관성 있는 DB상태여야 한다.

 

영속성, Durability

[트랜잭션의 특성 ACID] - 영어도 암기

1. 트랜잭션 실행 완료 시 결과는 계속 유지해야 한다.
2. 트랜잭션 실행 완료 시 그 결과는 영속적이어야 한다.

 

commit

DCL Control 종류


트랜잭션 실행이 성공적으로 종료되었음을 선언하는 연산?

 

rollback

DCL Control 종류


트랜잭션 실행이 실패하여 되돌아가야하는 연산은?

 

독립성, Isolation

[트랜잭션의 특성 ACID] - 영어도 암기

1. 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 없음 ( 동시에 병행 실행되는 경우)

 

ㅇㅇ

[회복(Recovery)]

실행 장애
트랜잭션 장애
시스템 장애
미디어 장애

라는게 있더라.

정답 ㅇㅇ

 

덤프, 로그

[회복(Recovery)]

중복 저장 기법의 종류 2가지는?

 

덤프

[회복(Recovery)]

주기적으로 DB 전체를 다른 장치에 복사하는 기법은?

 

로그

[회복(Recovery)]

DB 변경 될때마다, 이전 값 / 이후 값을 별도로 기록하는 방법은?

 

Redo

[회복(Recovery)]

회복의 원리

1. 트랜잭션이 완료 명령이 수행
2. 트랜잭션 변경 사항을 재수행 하는것은?
3. 영속성 보장

T1 Commit -> 붕괴 -> Redo 재수행

 

Undo

[회복(Recovery)]

회복의 원리

1. 트랜잭션 완료 명령을 수행하지 못했다면 갱신 사항을 취소하는 것은?
2. 원자성 보장

T1 처리중 -> 붕괴 -> Undo 취소

 

즉시 갱신

[회복(Recovery)]

회복기법의 종류

트랜잭션 연산 실행중에 데이터 변경 값을 '즉시' 반영하는것은?

 

지연 갱신

[회복(Recovery)]

회복기법의 종류

1. 트랜잭션 실행동안 변경된 내용을 '로그'에 보관
2. 트랜잭션 완료 시, 로그 내용을 반영

 

검사시점 회복

[회복(Recovery)]

회복기법의 종류

검사시점을 주기적으로 로그에 보관해서, 가장 최근의 검사시점으로 회복작업을 수행하는 것은?

 

그림자 페이징

[회복(Recovery)]

회복기법의 종류

1. 로그를 이용하지 않음
2. 트랜잭션 실행동안 DB 일정 크기의 '페이지'와 복사본인 그림자 페이지로 보관한다.
3. 회복시, 현 페이지 테이블-> 그림자 페이지 테이블로 교체

 

ㅇㅇ

[병행 제어]

병행제어의 문제점 4가지

갱신 분실
비완료 의존성
모순성
연쇄 복귀

정답 ㅇㅇ

 

갱신 분실, Lost UPdate

[병행 제어] 과거 기출

병행제어의 문제점

두 개 이상의 트랜잭션이 같은 자료를 공유하여, 수정할때, 수정 결과 일부가 분실되는 현상이다


A--->data<----B : 공유
1. 갱신
2. 분실

 

연쇄 복귀, Cascading Rollback

[병행 제어] 과거 기출

병행제어의 문제점


병행 수행되던 트랜잭션 하나 문제가 생겨
Rollback 하는데,

다른 트랜잭션도 함께 rollback 되는 현상임

 

모순성

[병행 제어] 덜 중요

병행제어의 문제점

두개의 트랜잭션 수행이 끝났찌만,
원치 않은 연산 결과가 나타나고
데이터베이스 자체도 모순된 상태로 남게 된 현상

 

비완료 의존성

[병행 제어] 덜 중요

병행제어의 문제점

하나의 트랜잭션이 수행이 실패한 후 회복되기 전에 다른 트랜잭션이 실패한 갱신 결과를 참조하는 현상이다.

 

로킹, Locking

[병행 제어 기법의 종류]

1. 데이터 액세스를 '상호 배타적'으로 병행제어하는 기법
2. 하나의 트랜잭션이 데이터 액세스 중, 다른 놈은 접근 불가하도록 함

 

2단계 로킹

[병행 제어 기법의 종류]

lock, unlock 할 수 있는 로킹은?

lock : 성장단계 growing
unlock: 축소단계 Sh rin king <- 추가

 

전용 로크

[병행 제어 기법의 종류]

로크 중

read O, write O 가능한 로크는?

 

공용 로크

[병행 제어 기법의 종류]

로크 중

read O, write X 가능한 로크는?

 

타임 스탬핑, Time Stamping

트랜잭션에 대기표를 부여해서 순서대로 실행되게끔 하는 것은?

 

데이터마트, Data Mart

작은 규모의 데이터 웨어하우스는?

 

OLTP, Online Transaction Processing, 온라인 거래 처리

1. 비즈니스 업무를 처리하는 과정에서 발생하는 데이터
2. 여러 사용자들이 '실시간'으로 데이터를 갱신 조회
3. 은행의 창구 업무, 항공사 예약 업무

 

OLAP, Online Analytical Processing, 온라인 분석 처리

1. 최종 사용자들이 다양한 분석을 하고 의사 결정을 하기 위한 다차원 정보들을 활용할 수 있게 함
2. 분석가에게 유용한 관점에서 데이터를 분석해서 뷰를 보여줌

 

ROLAP, Relational OLAP

1. 다차원 연산을 수행 가능하게 한다.
2. '관계형 데이터베이스' 내에 저장되어 있는 데이터를 요구하여 분석을 위한 정보를 제공
3. 스타 스키마 형태 구조

'대용량 처리에 좋음'
순차적 연산을 못함

 

MOLAP, Multidimensional OLAP

1. 데이터 베이스를 '큐브' 형태로 데이터 뷰를 작성해서 보여줌

'큐브 방식'
다차원 DB

빠른 다차원 분석
대용량 처리 어려움

 

HOLAP, Hybrid OLAP

신속한 응답의 장점 MOLAP + 미가공 데이터 검색의 장점 ROLAP 장점을 모두 수용한다.

 

데이터 마이닝, data mining

대용량의 데이터에서 필요한 지식을 얻고자 하는 과정이다.

 

빅 데이터

대량의 정형 비정형 데이터 집합, 이러한 데이터로 가치를 추출하고 결과를 분석하는 기술.

대규모 데이터

 

하둡, Hadoop

1. 오픈소스 기반의 데이터 관리 기술
2. 방대한 양의 데이터를 분산 처리하여 빠른 시간 내 결과를 제공해줌

해당 오픈 프레임워크는?

 

HOLAP, Hybrid OLAP

OLAP의 종류에는 관계형 데이터베이스와 관계형 질의어를 사용하여

데이터 웨어하우스에 저장된 다차원 데이터를 분석하는 Relation OLAP 와 다차원 데이터를 저장하기 위해 특수한 구조의 다차원 데이터베이스를 사용하고, 데이터 검색 속도 향상을 위해

주기억장치 속에 데이터 큐브를 보관하는 구조를 가지는

"Multidimensional(다차원) OLAP, 또한 ROLAP 와 MOLAP 의 특성을 모두" 가지고 있어

빠른 검색이 필요한 경우에는 요약을 메모리에 저장하고 기본 데이터나 다른 요약들을 관계형 데이터베이스에 저장하는 구조를 가지는 이것이 있다.

 

이상현상, Anomaly

데이터의 중복과 종속으로 인해 릴레이션을 조작할 때 곤란한 현상을 유발하는 것을 말하며, 삭제, 삽입, 갱신 등의 종류가 있는 것은?

 

데이터 웨어하우스(Data Warehouse)1

데이터 창고라는 의미로 어떠한 조직 내에 대규모의 일반적인 데이터들이 존재한다면,

그 "상위 개념의 데이터"로써 일정 시점까지의 그 일반 데이터들을 공통의 형식으로 일원화하고 요약하여 의사결정(Decision Making)의 중요한 역할을 하는 데이터를 말한다.

이를 위해 데이터 마이닝(Data Mining) 기법 중 하나인

다차원 구조 분석 기법과 온라인 검색을 지원하는 Online Analytical Processing 과 같은 지원 도구를 이용한다. 그 종류에는 ROLAP, MOLAP, HOLAP 등이 있다.

일반 데이터 -> 정리된 데이터: 의사결정 역할 데이터
-> 데이터 마이닝 기법 종류

OLAP
1. ROLAP
2. MOLAP
3. HOLAP

1

 

데이터 마트(Data Mart)

전사적으로 구축된 데이터 창고로부터, 특정 주제나 부서 중심으로 통합한 단일 주제의 "소규모 데이터 집단"을 말한다. 한마디로 데이터 창고의 축소판을 의미한다.

 

데이터 마이닝(Data Mining)

데이터 웨어하우스와 같은 대규모 데이터에서
표면적으로 보이는 데이터가 아닌,

"""사용자의 요구에 따라 유용하고 가능성 있는 새로운 정보를 발견하는 기법""""


을 말한다. 이를 통해 데이터 간 연관 관계, 유사 데이터 클러스터링, 데이터 특성 발견, 패턴 분석, 경향 분석 등이 가능하다.

 

Roll up

OLAP 온라인 분석 프로세싱에서

구체적 내용의 상세 데이터로부터 요약된 형태의 데이터로 접근하는 이것은?, (상세 -> 요약)

요약
|
상세

요상 하구만~

 

Drill down

OLAP 온라인 분석 프로세싱에서

요약된 형태의 데이터로부터 구체적 내용의 상세 데이터로 접근하는 OOOO ( 요약 -> 상세)

 

Pivoting

OLAP 온라인 분석 프로세싱에서

보고서의 행과 열의 위치를 변경하여 페이지의 차원을 바꿔 볼 수 있는 OO

 

Slicing

OLAP 온라인 분석 프로세싱에서

다차원 데이터 항목들(3차원 큐브)을 얇게 잘라 다양한 각도에서 조회하고 자유롭게 비교할 수 있는 OO

 

Dicing

다차원 데이터 항목들(3차원 큐브)을 얇게 잘라 다양한 각도에서 조회하고 자유롭게 비교할 수 있는 Slicing,

이 연산의 결과를 더 작게 쪼개어 작은 주사위 형태의 큐브모양으로 정보를 조합하여 분석정보를 보는 OO 연산

 

메타데이터, Meta Data

데이터에 관한 구조화된 데이터로써 다른 데이터를 설명해주는 데이터이며, 속성정보라고도 한다.

컴퓨터에서는 이것을 보통 어떠한 데이터를 표현하기 위한 목적으로 사용한다. 또 다른 목적으로는 인덱스 역할을 하여 데이터를 빨리 찾을 수 있게 한다.

 

다차원

데이터 마이닝 기법 중 하나인 OLAP 를 사용하여 데이터 웨어하우스의 데이터를 통합적으로 분석할 수 있다.

OLAP는 데이터 웨어하우스에 저장된 데이터를 롤업, 드릴다운 등을 통해 ( ) 분석을 위한 도구로 사용된다.

 

데이터 큐브, Data Cube

데이터가 여러 차원으로 모델링되는 것으로, 차원(Dimension)과 사실(Fact)로 정의되며,

여기서 차원은 한 조직이 그것에 대하여 기록하기를 원하는 시각이나 개체를 의미한다. 또한 이것은 MOLAP의 데이터 검색 속도 향상을 위해 주기억장치에 보관하는 구조를 가진다.

 

튜닝, Tunning

이것은 데이터베이스의 성능 향상 및 빠른 질의응답 등 시스템 최적화를 목적으로 재조정하는 것을 의미한다.

 

선택성, Selectivity

인덱스를 설계할 때 이것을 좋게 설계해야 하는데,

이것은 인덱스의 키 값 당 행의 개수를 기준으로 산정한다. 이것의 분포도가 낮다는 것은 인덱스의 키 값 당 많은 수의 행을 가지는 인덱스로써 남자의 경우 M, 여자의 경우 F의 두 가지 값만 가지는 성별과 같은 컬럼의 인덱스가 이에 해당한다. 또한 이것의 분포도가 높다는 것은 고객번호와 같이 키 당 하나 또는 소수의 값을 가지는 것으로 고유 인덱스가 가장 좋은 특성을 가진다.

 

MARC, Machine Readable Cataloging

메타데이터에는 다양한 형식이 존재한다.

그 중 가장 대표적인 것으로 기계가독목록을 의미하는 이것과 이를 보완하고 메타데이터 간의 호환성을 위한 DC(Dublin Core)가 있다.

컴퓨터를 이용하여 목록 데이터를 효율적으로 처리하기 위해서는 모든 데이터를 컴퓨터가 인식할 수 있는 형식으로 변환시키고 이를 정형화된 형식으로 배열해야 하는데,

이와 같이

""""""컴퓨터가 목록 데이터를 식별하고 축적/유통 할 수 있도록 코드화한 일련의 메타데이터 표준 형식"""""""""

데이터를 식별-> 마크 해두자!!!!!

을 말한다. 그러나 구조가 복잡하고 간결성, 효율성, 융통성면에서 제한적이고 새로운 환경에 적응하는 유연성이 부족한 단점을 가지고 있다.

 

상호 운용성

메타데이터를 구성하는데 염두해야 할 특성 중 하나로

"서로 다른 메타데이터를 사용하는 시스템들이 각각의 메타데이터를 서로 이해"

할 수 있게 함으로써 정보를 교환 및 이용할 수 있도록 하는 것을 말한다.

 

MDR, Meta Data Registry

다양한 메타데이터의 스키마 정보를 등록하여 상이한 메타데이터 스키마들 간의 기계적인 변환이 용이하도록 하며

메타데이터의 등록과 인증을 통해 "메타데이터를 유지/관리하며 메타데이터 명세를 공유하는 레지스트리"를 말한다.

메타데이터를 사용하여 데이터에 대한 접근과 사용을 촉진하고 메타데이터가 설명하는 특징에 따른 데이터의 조작을 가능하게 하며, 데이터 공유를 위하여 서로 다른 레지스트리 간의 상호 운용을 위한 구조를 갖는다.

 

Mapping Rule

개념적 데이터베이스 모델링의 ERD를 논리적 설계단계에서의 관계형 데이터베이스 모델로 1:1 대응시키는 것을 말한다. ERD의
개체(사각형)-> 릴레이션
속성(원) ->릴레이션의 컬럼
관계(마름모) -> 외래키로 대응된다.

ER 스키마를 관계 스키마 뭘한다?

영어로!

 

MODS, Metadata Object Description Schema

"디지털 도서관의 범용 서지 정보 표준 메타 데이터"로서 MARC, DC, ONIX 등을 절충하여 상호운용성과 정밀성을 모두 만족시킴

서어지 모드스

 

Mapping Rule

DB설계 단계 중 개념적 설계단계에서 논리적 설계단계로 구조를 변환 시키는 과정. 즉 개체-관계 모델을(ERD) 관계형 데이터베이스 모델로 사상시키는 것을 말한다.

 

후보키

유일하게 식별 가능한 속성이나 속성들의 집합을 의미하는 것으로,

유일성과 최소성을 만족하는 키?

 

슈퍼키

유일성 O
최소성 X

해당 키는?

 

DSMS, Data Streaming Monitoring System

센서 네트워크 응용서비스에서 센서 노트가 데이터를 끊임없이 계속하여 제공할 때, 이것의 이슈가 존재한다.

그 외에도 웹 서비스 추적 및 네트워크 시스템에 대한 모니터링 등의 다양한 응용분야에서

지속적이면서 연속적인 대규모 Dynamical Data에 대해 연속질의를 통한 제어가 가능하다.

 

Division

순수관계 연산에는 공통속성을 중심으로 2개의 릴레이션을 하나로 합쳐 새로운 릴레이션을 만드는 조인 연산이 있다.

또한 두 릴레이션이 있을 때 한 릴레이션에서 다른 릴레이션의 모든 조건을 만족하는 튜플들만을 추출해내는 ( )연산이 있다.

 

Data Cube

데이터가 여러 차원으로 모델링되는 것을 의미한다. 차원(Dimension)과 사실(Fact)로 정의되며,

여기서 차원은 한 조직이 그것에 대하여 기록하기를 원하는 시각이나 개체를 의미한다.

또한 이것은 """MOLAP의 데이터 검색 속도 향상을 위해 주기억장치에 보관하는 구조"""를 가진다.

 

Cloud

컴퓨터 네트워크상에 숨겨진 복잡한

인프라 구조와 인터넷을 은유적으로 표현한 것이다.

2008년 9월 2일에 선을 보인 구글 브라우저의 명칭인 '크롬'은 창문을 의미하는 속어다.

"집(PC)에 물건을 놓아둘 필요가 없다.

창문(단말기)을 통해서 구름 저 너머에 있는

정보와 소프트웨어를 필요할 때 그냥 꺼내 쓰기만 하면 된다.

 

실시간 처리, real time accessibility

실시간 접근, 내가 원할 때마다 바로 접근해서 자료를 처리할 수 있다.

무슨 처리?

 

동시 공용, concurrent sharing

여러 사용자가 같이 쓸 수 있어야 한다.

 

내용에 의한 참조, content reference

위치나 주소가 아닌 데이터의 내용 즉 값에 따라 참조할 수 있다

 

CASCADE

DROP, DELETE, UPDATE 의 옵션으로 테이블 혹은 튜플을 연쇄적으로 수정/삭제 하는 명령 키워드

 

트랜잭션 특징 -A,C,I,D

Atomicity (원자성)
: 모두 반영되거나 아니면 전혀 반영되지 아니어야 된다
.
Consistency (일관성)
: 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관서 있게 DB 상태를 변환

Isolation (독립성,격리성)
: 둘 이상의 트랜잭션이 병행 실행 중일 때, 다른 트랜잭션 연산이 끼어들수 없다

Durability (영속성,지속성)
: 트랜잭션의 결과는 영구적으로 반영

 

Trigger

특정 테이블의 데이터에 변경이 가해졌을 때 연쇄적으 로 수행되는 저장 함수라고 할 수 있다

 

ㅇㅇ insert

SQL (INSERT INTO)

INSERT INTO 학생
Values(1234, '한국산', 3, '경영학개론', '?-1234-1234');

정답 ㅇㅇ insert

 

이상현상

데이터베이스 설계 시
데이터의 '중복'과 '종속'으로 인해 발생되는 문제점

발생원인:
이상현상의 발생 원인은 '릴레이션'에서
일부 '속성들의 종속'으로 인해
'데이터의 중복'이 발생하기 때문이다.

종류 : 삽입(INSERT)이상, 삭제(DELETE)이상, 갱신(UPDATE)이상

 

MDR (Metadata Registry, 메타데이터 등록소)

메타데이터의 등록과 인증을 통하여
메타데이터를 유지 ㆍ관리하며, 메타데이터의
명세를 공유하는 레지스트리.

 

메타데이터 (Metadata)

데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터. 시스템 카탈로그에 저장되어 있다.

 

SQL (DELETE)

SQL (DELETE)

DELETE FROM 사원 -> 간 델! 프!
WHERE 이름 = 'scott';

 

÷ (DIVISION)

A, B 릴레이션에서
B릴레이션 조건에 만족하는 열만 프로젝션 하는 것

 

데이터마이닝

인공 지능 기법을 이용하여 대용량의 데이터에서 의미 있는 통계적 패턴이나 규칙, 관계를 찾아내 분석함으로써 유용하고 활용 가능한 정보를 추출하는 기술.

 

군집화

[기술해야함]

서로 유사한 정도에 따라
다수의 객체를 군집으로 나누는 작업

또는 이에 기반한 분석.


유사 -> 다수 객체 -> 군집 나누기

 

병행제어

동시에 여러 개 수행할 때,
데이터베이스 일관성 유지를 위해
트랜잭션 간의 상호 작용을 제어

A, B ,C 수행-> 일관성 유지 -> 트랜잭션 상호작용 제어

무슨 제어인가??

 

로킹기법 (Locking)

[병행제어 기법]

하나의 트랜잭션이 데이터를 액세스하는 동안

다른 트랜잭션이 그 데이터 항목을

액세스할 수 없도록 하는 기법은?

 

역정규화, 비정규화(denormalization)

시스템의 성능 향상을 위해서 정규화에 위배되는 행위를 하는 것.

 

SQL (CREATE)

NOT NULL
PRIMARY
FOREIGN(자식) REFERENCES 부모T(자식)

 

제약조건

데이터베이스에 저장되는 데이터의 정확성을 보장해주기 위하여 키를 이용하여 입력되는 데이터에 제한을 주는 것

(개체 무결성 제약조건) :
릴레이션의 기본키를 구성하는
어떠한 속성도 NULL 값이나 중복값이 될 수 없다

(참조 무결성 제약조건) :
릴레이션은 참조할 수 없는 외래키 값을 가질 수 없다
(A테이블이 B테이블을 참조할 때,
A테이블의 외래키=B테이블의 기본키)

제약조건

 

RESTRICT

삭제/수정을 하는데, 관련된 참조테이블이 있으면 삭제/수정을 하지 않도록 하는 옵션 키워드

 

CASCADE

원본(부모)테비블을 삭제/수정하면 참조(자식)테이블도 연쇄적으로 삭제/수정시키는 옵션 키워드

 

다차원

Data warehouse 는 (OOO) 데이터베이스이다

 

ㅇㅇ

OLAP : 사용자가 DB 검색/분석을 통해
문제해결을 찾도록 해주는 분석형 어플리케이션

cf)
ROLAP : 질의 처리 시간을 줄이기 위해 집계 테이블을 생성/저장하여 두는 시스템으로
-> 관계형 DB 기반 OLAP 구조 (Relational OLAP)

MOLAP : 결과를 다차원 배열로 저장하여 '큐브' 형태의 데이터 뷰로 다양한 분석을 할 수 있도로 지원하는
-> 다차원 DB 기반 OLAP (Multidimensional OLAP)


HOLAP : 다차원 DB + 관계형 DB 함께 쓸 수 있도록
MOLAP과 ROLAP 의 장점을 혼용한 시스템
-> (Hybrid OLAP)

ㅇㅇ

 

Trigger

트리거가 어떤 이벤트가 발생했을 때
조건이 참이 되면 트리거와 연관된 동작이 수행되고,
그렇지 않으면 아무 동작도 수행되지 않음.

 

Event (이벤트)

데이터베이스의 항목을 변경시키는 일의 발생

 

MAX

그룹함수(복수행함수) :
하나 이상의 행을 그룹을 묶어 연산하여,
하나의 결과를 나타내는 함수

SUM : 해당 속성에 대한 "튜플의 값들의 총합"을 구하는 함수

AVG : 해당 속성에 대한 "튜플의 평균"을 구하는 함수

MAX : 지정한 튜플 값들 중에서 "최댓값"을 구하는 함수
-> 16. 3회 기출
MIN : 지정한 튜플 값들 중에서 "최솟값"을 구하는 함수

COUNT : 릴레이션에서 해당 조건을 만족하는 "개수"를 반환하는 함수

GROUP BY ~ HAVING 절 : 특정 속성을 기준으로 릴레이션에 조재하는 행들을 그룹별로 구분하기 위해 사용

정답 MAX

 

select sql

SELECT 주문번호, 주문수량
FROM 주문변경
WHERE 사업부코드 = "1234" AND 변경일자 = MAX;


정답 select sql

 

DSMS
(Data Stream Management System)

실시간으로 발생하는 대용량 데이터 스트림을 효율 있게 관리하려고 정형화된 데이터 스트림을 관리하는 시스템

 

Big Data

기존의 관리 방법이나 분석 체계로는 처리하기 어려운 막대한 양의 정형 또는 비정형 데이터 집합.

 

Tunning, 튜닝

데이터베이스의 비효율적인 요소를 제거하고, 여러요소를 조정(최적화)하는 작업

 

Clusterd (INDEX)

물리적으로 테이블의 데이터를 재배열
: 데이터의 삽입순서와 상관없이 인덱스로 생성되어 있는 컬럼을 기준으로 정렬되어 삽입된다.

 

Non-clustered (INDEX)

물리적으로 데이터를 배열하지 않은 상태로
데이터 페이지가 구성

중간 레벨 인덱스 페이지들을 생성하고,
이 인덱스 페이지를 찾기위한
루트 레벨 인덱스 페이지를 생성

 

Shared Data

<데이터베이스 정의>
Intergrated Data (통합된 데이터) :
중복을 최소화한 데이터의 모임

Stored Data (저장된 데이터) :
저장매채에 저장된 데이터

Operational Data (운영 데이터) :

Shared Data (공유 데이터) :
여러 사용자들이 정보를 공동으로 이용할 수 있도록 한 데이터
-> 기출

 

ㅇㅇ

<데이터베이스 특징>
Concurrent Sharing (동시공유)
Continuous Evolution (계속적이 변화)
Real-Time Accessibility (실시간 접근성)
Contents Reference (내용에 의한 참조)

정답 ㅇㅇ

 

MARC
(Machine Readable Cataloging, 기계가독 목록)

서지 자료 및 관련 정보를
컴퓨터용 양식으로 교환ㆍ저장하는데 사용되는 부호화 포맷.

(컴퓨터가 목록를 식별하여 축적·유통할 수 있도록 코드화한 일련의 메타데이터 표준 형식)

식별 뫄크!!

 

상호운용성

[메타데이터 구축 데이터포맷] : MARC, DC, ONIX, MODS

MARC : 컴퓨터가 목록를 식별하여 축적·유통할 수 있도록 코드화한 일련의 메타데이터 표준 형식 -> 식별 뫄크!

DC : 네트워크 환경에서 각종 전자 정보를 기술하는 핵심적인 데이터 요소

ONIX : 유통에 관한 통계와 체계적인 정보를 취급함으로써 정상적인 유통 및 관리를 하기 위해 개발

MODS : 상호운용성, 정밀성을 모두 만족시킨 디지털 도서관의 범용 서지정보 표준 메타데이터로서
디지털 도서관의 요구에 가장 부합되는 특성
-> 써지 모드s

정답 상호운용성

 

Mapping Rule, 사상

개념적 DB 모델링 결과를
관계형 데이터베이스 이론에 근거하여
데이터베이스 구조로 변환하는 과정

개념적DB 모델링-> 관계형 DB 구조로 변환하는 과정
ER 스키마 -> 관계 스키마

 

기본키

1. 기본키 : 후보키 중 특별히 선택된 키 ( 중복x , NULL x)
-> 출제

2. 대체키 : 후보키 중 기본키를 제외한 후보키

3. 후보키 : 유일하게 사용되는 속성들의 집합
(유일성ㅇ, 최소성 ㅇ)

4. 슈퍼키: 유일성ㅇ, 최소성X

5. 외래키 : 다른 테이블을 참조하기 위한 키 ( 외래키 = 참조 테이블의 기본키 )

6. 복합키 : 2개 이상의 속성으로 구성된 키

 

식별, 비식별

1)식별관계 : 상위(부모) 개체의 기본키가 하위 개체에 기본키로 전이되는 관계
상위(부모) 개체 기본키 -> 하위 개체 '기본키'로 전이
부모의 Basic 집키를 자식에게 물려줌

2)비식별관계 : 상위 개체의 기본키가 하위 개체에 일반 속성으로 전이되는 관계
상위 개체 기본키 -> 하위 개체 '일반속성' 전이

 

foreign key

FOREIGN KEY ( ) REFERENCE (참조테이블명)( * )
A테이블이 B테이블을 참조할 때,
* : A테이블의 외래키
** : B 테이블의 기본키
cf) 참조무결성 제약조건

 

VIEW

가상 테이블로서 물리적으로 존재하지 않으면서 마치 데이터를 가지고 있는 테이블로 보여짐

 

INDEX

데이터베이스에서 원하는 데이터를 좀더 빨리 찾아줄 수 있도록 데이터의 위치정보를 모아 둠

 

다치종속성, 4NF

조인종속성을 가졌다고 하고 A↠B로 표기한다.

다치 ! much!
->> 화살표가 much!! 다치!!

X →> B
여러개의 B의 값을 갖는다

 

자연조인

두 릴레이션의 공통된 속성(Common Attribute)을
매개체로 하여 두 릴레이션의 정보를 관계로 묶어 내는 연산

세타 -> 동등 -> (동등 중복제거된)자연 조인

자연조인!

 

JOIN

하나의 SQL 명령문으로 여러 테이블에 저장된 데이터를 한 번에 검색할 수 있는 강력한 기능

table A
table B 합췌!!

Selection 수평적 horizon 시그마
Projection 수직적 Vertical 파이
Car te sian Product 카티션 프로덕트 X
UNION은 합집합
Intersection 교집합

 

정규화, Normalization

1. 데이터의 중복성과 종속성을 해결하기 위함
2. 릴레이션을 분해나가는 과정
3. 이상현상
삽입, 삭제, 갱신 이상의 발생 가능성을 줄여줄 수 있다

 

1:M (일대다)

------------------- : 1 : 1
-----------------<- : 1 : M
->--------------<- : N : M
-O--------------O- : 관계 O or X

 

BETWEEN

1. WHERE 점수 >= 85 AND 점수 <= 90;
2. WHERE 점수 BETWEEN 85 AND 90;

결과 같음

 

무결성

DB 저장 데이터 값이 현실 실제 값과 일치하는 정확성을 의미하는 것은?

 

복합키 (Composite Key)

2개 이상의 속성으로 구성된 키

 

ㅇㅇ

[DDL] 테이블 설정
Create
Alter
Drop

[DML] 튜플 설정
Select
Insert
Delete
Update

[DCL]
Grant
Revoke
Commit
Rollback

ㅇㅇ

반응형