본문 바로가기
@MucKoo's ComfyUI Bible @/#ComfyUI Navigator#

CFG(Classifier-Free Guidance)

by MucKOO 2025. 5. 3.
반응형

AI 이미지 생성의 핵심 조정 값 중 하나인 CFG(Classifier-Free Guidance)에 대해
완전 분석 들어가자.  이거 이해 안 되면, 프롬프트 조절도, 이미지 디테일 튜닝도 헛수고 될 수 있어.

 

CFG란?  Classifier-Free Guidance의 줄임말.

텍스트 조건(프롬프트)을 얼마나 강하게 반영할지 조절하는 기법이야. 그리고 그걸 위해 “ Classifier (분류기)” 없이 작동하는 걸 의미해. 

원래 방식 Classifier Guidance (옛날 방식), 초기 GAN이나 이미지 생성 모델은
진짜-가짜 판별기(Classifier 또는 Discriminator)가 필요했어. 이 판별기가 “이 이미지가 조건에 맞나?”를 판단해주면서
생성기(Generator)를 유도했지. 근데 이 방식엔 단점이 있었어 판별기를 따로 훈련해야 했어 (복잡해짐)
생성기와 싸움하듯 훈련되면서 불안정 해지고 모델의 해석력이 떨어지면 품질도 낮아졌지.

 

그래서 나온 대안이 Classifier-Free Guidance , Classifier 없이도, 프롬프트와 조건 없는 이미지 사이의 차이만으로
“얼마나 프롬프트에 충실하게 이미지 만들래?”를 조정하는 방식이 나온거야.

왜 이렇게 하냐구? 별도의 분류기 없이도 프롬프트를 반영할 수 있어서 구조가 단순해고 훈련이 안정적이고 빨라서야.
정확도도 높고 유연성도 생기지.

 

 

 

GAN? 가짜를 진짜처럼 만드는 마법 같은 기술

ComfyUI를 공부하다보면 가끔 씩 어디에선가 보이는 GAN이라는 놈이있다.Stable Diffusion이나 ComfyUI 이전에, AI 이미지 생성의 역사를 판 바꾼 놈이지.ComfyUI는 GAN 모델을 직접 쓰진 않지만, GAN에서 파생

designmoney.tistory.com

 

한마디로 CFG는 AI가 얼마나 ‘프롬프트에 충실할 것인가’를 정하는 값이야.
쉽게 말하면?   AI한테 얼마나 ‘말 잘 듣게’ 시킬지 조절하는 슬라이더인거지.

낮추면: “알아서 좀 해봐” 
높이면: “내 말 그대로 해!”

 

예를 들어:
CFG 1 → 너 하고 싶은 대로 해봐
CFG 7 → 내 말 좀 반영해줘
CFG 12 → 시키는 대로 해! 절대 벗어나지 마!

이미지 출처:  https://stable-diffusion-art.com/automatic1111/

작동 원리 (조금만 깊게)
Stable Diffusion이나 ComfyUI에서 이미지 생성은 두 개의 latent 예측을 조합해서 만들어져.
조건 있음: 내가 준 프롬프트에 기반한 예측
조건 없음: 프롬프트 없이 모델이 ‘알아서’ 만든 예측
이 둘을 섞을 때 얼마나 프롬프트 쪽으로 기울일지를 결정하는 게 CFG 값이야.

공식적으로는 최종 예측 = 조건 없음 + CFG × (조건 있음 - 조건 없음)
이 계산식이야. 즉, CFG가 클수록 ‘프롬프트 영향력’이 강해진다는 거지.

CFG 값을 조절하면 생기는 변화
1~3 자유로움, 창의적, 예상 밖 결과 배경, 색상 등이 다양함
6~8 균형 잡힘, 일반적으로 추천 의도한 내용이 잘 나오면서, 품질도 안정적
10~15 프롬프트에 매우 충실, 하지만 부자연스러움 가능 너무 정형화된 이미지, 왜곡 발생
20 이상 오히려 품질 저하 가능 색이 깨짐, 노이즈 증가


CFG는 ‘AI 말 잘 듣는 정도’를 조절하는 값 낮으면 창의적, 높으면 정밀하지만 과하면 부작용
6.5~8.5 구간이 일반적으로 가장 좋은 결과 너무 높이면 색감 깨짐, 얼굴 이상함, 노이즈 증가 등의 문제 발생
모델에 따라 최적의 CFG가 다르니 실험하면서 감을 익혀야 해!!

반응형