ComfyUI를 공부하다보면 가끔 씩 어디에선가 보이는 GAN이라는 놈이있다.
Stable Diffusion이나 ComfyUI 이전에, AI 이미지 생성의 역사를 판 바꾼 놈이지.
ComfyUI는 GAN 모델을 직접 쓰진 않지만, GAN에서 파생된 개념과 결과물은 다양한 방식으로 녹아들어 있어.
특히 StyleGAN의 얼굴 생성, CycleGAN의 스타일 전환 개념은 img2img + ControlNet 조합으로 완벽히 재현 가능해.
그러니 GAN이 어떤 놈인지만 알고 있자고.
StyleGAN(전통 GAN 시대) → Stable Diffusion(확산 시대) → ComfyUI(도구/플랫폼화)
이렇게 기술이 점점 ‘정교하게’, ‘접근 가능하게’ 진화해왔다.
GAN( Generative Adversarial Network)- 서로 경쟁하면서 이미지를 생성하는 신경망 구조
1.Generative
뜻: 생성하는, 만들어내는
역할: 뭔가를 새로 만들어내는 애야.
여기선 이미지, 텍스트, 음성 등 ‘데이터’를 만들어냄
대응되는 AI 역할: Generator (생성자)
2. Adversarial
뜻: 적대적인, 대립하는
설명: 서로 맞붙는 구조를 뜻해.
여기선 생성자와 감시자(판별자)가 싸우는 관계
핵심 키워드: 경쟁, 대결, 상호 학습
3. Network
뜻: 신경망, 연결망
설명: 딥러닝 모델의 구조적 단위
여기에선 Generator와 Discriminator가 각각 하나의 신경망(Neural Network)으로 존재
* Discriminator-식별하는 사람,판별장치, GAN 전체 구조에서 Discriminator는 감시자, 판별자, 비평가 역할
말 그대로
“생성자와 적대자(판별자)가 싸우면서 발전하는 네트워크”야.
가짜 데이터를 만들어내는 AI라고 생각하면 돼. 두 개의 인공지능이 서로 경쟁하면서 점점 더 진짜 같은 데이터를 만드는 기술이지.
화가(Generator): 이 친구는 가짜 그림(데이터)을 그려. 처음엔 엉성하지만 점점 진짜처럼 그리려고 노력하지.
비평가(Discriminator): 이 친구는 그림이 진짜인지 가짜인지 판별해. "이건 진짜야!" 또는 "이건 가짜야!"라고 말하는 거지.
화가는 비평가가 가짜라고 못 알아차리도록 그림을 더 잘 그리려고 하고 비평가는 진짜와 가짜를 더 잘 구분하려고 훈련하는거야.
이 경쟁을 계속하다 보면, 화가가 그린 그림이 진짜와 거의 똑같아져!
Generator (생성자) 랜덤한 노이즈를 받아서, 진짜 같은 이미지를 생성
Discriminator (판별자) 입력 이미지가 진짜(실제 데이터) 인지 가짜(Generator가 만든)인지 판단
GAN( Generator → Discriminator 의 피드백 → Generator 개선) 이 루프가 계속 돌면서 진짜 같은 이미지를 만듬.
지금은 Diffusion 방식이 주류지만, GAN은 여전히 스타일 변환, 영상 생성, 저해상도 업스케일 등에서 활용된다.
'@MucKoo's ComfyUI Bible @ > #ComfyUI Navigator#' 카테고리의 다른 글
Steps! 진화 과정의 단계 수 (0) | 2025.05.03 |
---|---|
CFG(Classifier-Free Guidance) (0) | 2025.05.03 |
Seed 완전 분석: 초기 노이즈, VAE, Sampler, Batch Size의 관계 (1) | 2025.05.02 |
Seed란 무엇인가. (0) | 2025.05.02 |
Checkpoint의 출력은 왜 3개일까? (0) | 2025.04.26 |