'Video Coding' 태그의 글 목록

Video Coding

2018. 12. 4. 11:49

복습

fft, dct를 하고 아래쪽을 잘라서 invers해보면 fft보다 dct가 더 원래값과 비슷함
fft는 실수와 허수로 표현하여 위상과 magnitude를 알 수 있음, dct는 실수로만 표현되어 위상을 표시못함 -> 이미지 프로세스에는 위상이 필요없기에 그냥 dct만 사용하는 것이지 다른 용도에서는 fft를 사용하기도 함

8x8만큼 잘라낸 이미지에 128을 빼주고 dct를 행함 -> 2차원 dct에서 왼쪽 상단의 값들만 있어도 어느정도 복구가 됨
Quantization matrix로 각 자리의 값들을 나눠서 고주파성분을 버림 -> 압축률을 높이는 경우에는 matrix에 q값을 곱하여 높일 수 있고, 원본값과 최대한 같게 하기 위해서 q값을 줄여서 곱하여 고주파성분을 어느정도 살릴 수 있음
가장 처음에 있는 값은 DC성분으로 DPCM(각 8x8그룹들의 DC성분들만 뽑아서 이전값과 빼주면서 전송 -> 가장 첫번째 값은 이전값이 128이라고 생각함)을 행함
ZIGZAG방식으로 순서를 기록

(8x8 x 8bits)/60bits = 8.5
60/64 = 0.94 -> 이값은? 픽셀당 0.94bit만큼 필요하다는 의미 - 총 pixel개수가 64bit인데 이를 60bit로 압축 했기 때문에 1bit보다 적은 값이 필요

sub-sampling

RGB를 표시할 때, 3채널을 전부 처리하여 합쳐야 했기에 수행시간이 오래 걸린다는 것을 배웠음
이 문제를 해결하기 위해 Y Cb Cr로 바꿔서 한 채널만 처리하면 시간이 줄어들지만 압축을 하는 경우에는 왜 나머지 두 채널을 압축하지 않는가?

-> Cb Cr은 인간이 구분하지 못하는 채도성분이기 때문에 YCbCr중 Y는 전부 보내고 CbCr부분은 Y값 2개당 하나씩 넣어서 반으로 줄임 - 512x256
Y 4개당 CbCr 1개로 하는 경우도 있음 -> 256x256

Video Coding

어느 순간의 비디오 클립을 여러장 나열해서 보면 움직이는 물체는 정해져있고 나머지 값들은 동일
시공간적인 redundancy가 존재하므로 이전값과 빼서 차성분을 인코딩하는 방식도 있음 -> temporal redundancy
차성분이 이전과 현재의 움직임을 담고 있으므로 좀 더 줄일 방법을 찾음 -> 현재 프레임의 움직인 블록은 이전 프레임의 어딘가에 존재한다고 생각함
그러므로 현재 프레임의 움직인 블록크기 만큼 전체 이미지를 잘라내어 이전 프레임의 어느 블록에 있었는지 예측하는 방식을 사용 -> motion estimation : 이전 프레임에서 가장 유사하다고 판단되는 것을 찾음
만약 움직임이 없었다면 현재와 동일한 위치에 있을 것이고 움직였다면 조금 다른 위치에 있었을 것 -> 움직임을 motion vector라고 함
일정 범위를 정해놓고 위치를 찾는 것 -> motion estimation
motion vector와 차성분 모두 전송해서 처리
true motion vector가 아닐 수도 있고 압축을 많이 해야하는 경우에는 시간이 오래걸리지만 차성분만 압축하므로 이 방식을 사용

MPEG encoding process

Wavelets

A Simple Wavelet Transform

chapter 10 - Morphological Operators (0)	2018.12.11
[11월29일]JPEG 압축, 복원 (0)	2018.11.29
[11월27일]IMAGE CODING AND COMPRESSION (0)	2018.11.27
[11월22일]chapter13 - Color Processing (0)	2018.11.23
[11월14일]2차 Derivative에 따른 edge 검출 (0)	2018.11.23

PREV 1 NEXT