[PostgreSQL] MVCC란?

IT/PostgreSQL

자연산 금붕어 2025. 2. 28. 09:41

이전 버전 데이터와 현재 버전 데이터를 동일한 테이블 내에서 보관
그로 인해 Dead Tuple이 증가하여 테이블 사이즈 Bloat현상이 발생
- Bloat 현상 : 실제 데이터 크기보다 데이터베이스 크기가 커지는 현상
각 레코드(row)별로 4Byte의 XID(버전 정보)를 주어 시점을 식별
Vacuum을 통해 MVCC로 발생하는 Dead Tuple 관리

Oracle
- Oracle, MySQL은 최신 버전 데이터만 DB에 저장
- 이전 데이터는 Undo를 이용하여 저장
- 데이터가 갱신되면 Undo 영역에는 이전 데이터블록들 값과 당시 SCN(System Commit Number) 저장
- Select 조회 시 새로운 최신 SCN의 값을 가지며 이 SCN 값 이전 블록들 값을 읽게 됨
PostgreSQL
- DB내에 다중 버전의 데이터를 저장
- 더 이상 필요하지 않을 때 데이터를 정리 (=Vacuum)
- DB내에 다중 버전 데이터 저장 -> 데이터가 많아져 파일 사이즈가 증가 -> 기존의 데이터는 삭제 표시가 생김

트랜잭션이 발생한 시점을 식별하기 위한 정보
- 트랜잭션이 일어날 때마다 하나씩 증가하며, MVCC 모델의 구현과 읽기 일관성을 위해 사용
PostgreSQL의 XID는 레코드(row) 단위로 할당하며 48Byte로 표현되며 최댓값은 약 43억이며 순환 구조로 되어있음
PostgreSQL에서 하나의 튜블은 xmin, xmax의 2개의 트랜잭션 ID를 가짐
Tuple이 생성된 시점은 xmin / Tuple이 삭제되는 (이전의 값)인 경우는 xmax로 XID를 저장
다른 세션에서 해당 데이터를 조회 시 사용되는 XID가 xmin과 xmax 사이면 보임
- xmin과 xmax 사이가 아니면 보이지 않음
수행시점의 XID와 레코드의 XID(XMIN)의 비교를 통해 MVCC구현
Wraparound를 피하기 위해 XID Age가 약 21억 넘어가기 전 해당 자료들의 XID를 Frozen XID라는 특수 값으로 표시하여 영구적인 과거 데이터임을 표시

자연산 금붕어의 수족관