반응형
이미지 normalize의 중요성
toy experiment

image = self.vae.decode(pred_original_sample.to(self.weight_dtype)).sample
image를 vae에서 처음 추출했을 때
image 값의 범위

image의 값의 범위는 -1 ~ 1 사이에 있었다.
image를 저장해보기

이 이미지를 255 값으로 바꾸고 이미지를 출력해봤을 때

이렇게 원래 이미지 색깔이 안나오는 문제가 발생한다
image normalize clamp(0,1)
image = (image / 2 + 0.5).clamp(0, 1)
image = (image / 2 + 0.5).clamp(0, 1)
따라서 normalize를 0~1로 해야 255 값 내의 이미지로 복원이 가능하다
반응형
'Deep learning' 카테고리의 다른 글
Overleaf column width figure 너비 / cm 단위 저장 (0) | 2024.10.15 |
---|---|
[코드] 이미지의 패치 단위 얼만큼 차지하는지 보는 코드 / 패치 별 평균 보는 방법 (0) | 2024.08.01 |
Imagenet에서 이미지 생성 / class-conditional과 resolution task (1) | 2024.04.18 |
대규모 언어모델의 Training compute / 구성요소 (0) | 2024.04.18 |
Take home message에 대해서 (0) | 2024.04.18 |