AI 이미지 생성의 핵심 조정 값 중 하나인 CFG(Classifier-Free Guidance)에 대해
완전 분석 들어가자. 이거 이해 안 되면, 프롬프트 조절도, 이미지 디테일 튜닝도 헛수고 될 수 있어.
CFG란? Classifier-Free Guidance의 줄임말.
텍스트 조건(프롬프트)을 얼마나 강하게 반영할지 조절하는 기법이야. 그리고 그걸 위해 “ Classifier (분류기)” 없이 작동하는 걸 의미해.
원래 방식 Classifier Guidance (옛날 방식), 초기 GAN이나 이미지 생성 모델은
진짜-가짜 판별기(Classifier 또는 Discriminator)가 필요했어. 이 판별기가 “이 이미지가 조건에 맞나?”를 판단해주면서
생성기(Generator)를 유도했지. 근데 이 방식엔 단점이 있었어 판별기를 따로 훈련해야 했어 (복잡해짐)
생성기와 싸움하듯 훈련되면서 불안정 해지고 모델의 해석력이 떨어지면 품질도 낮아졌지.
그래서 나온 대안이 Classifier-Free Guidance , Classifier 없이도, 프롬프트와 조건 없는 이미지 사이의 차이만으로
“얼마나 프롬프트에 충실하게 이미지 만들래?”를 조정하는 방식이 나온거야.
왜 이렇게 하냐구? 별도의 분류기 없이도 프롬프트를 반영할 수 있어서 구조가 단순해고 훈련이 안정적이고 빨라서야.
정확도도 높고 유연성도 생기지.
GAN? 가짜를 진짜처럼 만드는 마법 같은 기술
ComfyUI를 공부하다보면 가끔 씩 어디에선가 보이는 GAN이라는 놈이있다.Stable Diffusion이나 ComfyUI 이전에, AI 이미지 생성의 역사를 판 바꾼 놈이지.ComfyUI는 GAN 모델을 직접 쓰진 않지만, GAN에서 파생
designmoney.tistory.com
한마디로 CFG는 AI가 얼마나 ‘프롬프트에 충실할 것인가’를 정하는 값이야.
쉽게 말하면? AI한테 얼마나 ‘말 잘 듣게’ 시킬지 조절하는 슬라이더인거지.
낮추면: “알아서 좀 해봐”
높이면: “내 말 그대로 해!”
예를 들어:
CFG 1 → 너 하고 싶은 대로 해봐
CFG 7 → 내 말 좀 반영해줘
CFG 12 → 시키는 대로 해! 절대 벗어나지 마!
작동 원리 (조금만 깊게)
Stable Diffusion이나 ComfyUI에서 이미지 생성은 두 개의 latent 예측을 조합해서 만들어져.
조건 있음: 내가 준 프롬프트에 기반한 예측
조건 없음: 프롬프트 없이 모델이 ‘알아서’ 만든 예측
이 둘을 섞을 때 얼마나 프롬프트 쪽으로 기울일지를 결정하는 게 CFG 값이야.
공식적으로는 최종 예측 = 조건 없음 + CFG × (조건 있음 - 조건 없음)
이 계산식이야. 즉, CFG가 클수록 ‘프롬프트 영향력’이 강해진다는 거지.
CFG 값을 조절하면 생기는 변화
1~3 자유로움, 창의적, 예상 밖 결과 배경, 색상 등이 다양함
6~8 균형 잡힘, 일반적으로 추천 의도한 내용이 잘 나오면서, 품질도 안정적
10~15 프롬프트에 매우 충실, 하지만 부자연스러움 가능 너무 정형화된 이미지, 왜곡 발생
20 이상 오히려 품질 저하 가능 색이 깨짐, 노이즈 증가
CFG는 ‘AI 말 잘 듣는 정도’를 조절하는 값 낮으면 창의적, 높으면 정밀하지만 과하면 부작용
6.5~8.5 구간이 일반적으로 가장 좋은 결과 너무 높이면 색감 깨짐, 얼굴 이상함, 노이즈 증가 등의 문제 발생
모델에 따라 최적의 CFG가 다르니 실험하면서 감을 익혀야 해!!
'@MucKoo's ComfyUI Bible @ > #ComfyUI Navigator#' 카테고리의 다른 글
sampler_name (1) | 2025.05.04 |
---|---|
Steps! 진화 과정의 단계 수 (0) | 2025.05.03 |
GAN? 가짜를 진짜처럼 만드는 마법 같은 기술 (0) | 2025.05.03 |
Seed 완전 분석: 초기 노이즈, VAE, Sampler, Batch Size의 관계 (1) | 2025.05.02 |
Seed란 무엇인가. (0) | 2025.05.02 |