먹구형이 페이스북에 떠도는 AI 프롬프트 하나를 딱 넣었는데, 이상한 일이 벌어진 거야
프롬프트
"Name" from "story name" as a real person, looking at the camera,a low-ngle shot with a wide lens (or wide-angle distortion),Extreme macro, Zeiss 24 mm: glossy, true 8K skin detail,9:16 shot of a Y2K Arctic Chill color palette corridor.
이 프롬프트야. 간단히 말하면, 실제 인물처럼 보이는 캐릭터를 광각 렌즈로 아래에서 위로 촬영하고, 피부 디테일이 8K급으로 살아 있고, 시원한 색감의 복도 안에 세워달라는 요청이지.
그런데 DALL·E에 넣었더니 여성이 나왔고, ComfyUI에 넣으니까 남성이 튀어나온 거야.
"뭐야 이거, 둘 다 같은 말했는데 왜 딴소리야?" 이게 궁금해서 형이 제대로 파헤쳐봤다.
*여자가 DALL·E ChatGPT로 그렸다. 남자가 ComfyUI Hidream i1
모델 자체의 구조적 차이: DALL·E vs ComfyUI (Stable Diffusion)
기본 추론 | 자연어 기반 의미망 추론 (문장 전체 맥락 이해) | 키워드 기반 시각적 매핑 (프롬프트 단어 단위 해석) |
모델의 성별 경향 | 종종 여성 캐릭터 우선 생성 (특히 'Name'이나 'story' 관련 문맥) | 체크포인트나 베이스 모델에 따라 남성 캐릭터가 디폴트일 수 있음 |
렌즈/구도 해석 | 문맥에서 추론된 시점 사용 → 주로 아이레벨 중심 | 명시하지 않으면 정면 또는 정면 가까운 고정 구도 사용 |
기본 뉘앙스 처리 | "as a real person" → 영화·드라마 여주인공 연상 | ComfyUI는 그런 뉘앙스를 "generic male face"로 처리 가능 |
왜 이런 일이 생겼는지 알겠지?
AI마다 해석 방식이 다르기 때문이야. DALL·E는 문장을 전체로 이해해.
말하자면, “이건 뭔가 영화 속 여주인공을 현실로 꺼낸 느낌”이라고 문맥을 읽는 뇌를 가진 AI야.
ComfyUI는 단어 단위 키워드 해석 기반이야. 명확한 명령이 없으면 기본값으로 남성 얼굴을 뱉는 경우가 많지.
프롬프트를 해부하라: 그림을 말로 푸는 기술
지난 시간에 우리가 배운 게 있었지. 프롬프트는 복붙하면 안 된다. 그걸 아무 생각 없이 쓰면, 남자 나올 줄 몰랐는데 튀어나오고, 광각 줬다는데 정면 얼굴이 나오는 이상한 일이 생기는 거야.
designmoney.tistory.com
프롬프트에서 성별을 지정 안 했어
“Name from story name”
→ 이게 누구든 될 수 있는 말이잖아? 남자일 수도, 여자일 수도. DALL·E는 뉘앙스로 “여자겠네”라고 판단했고,
ComfyUI는 그냥 "기본값=남자"로 간 거지.
카메라 앵글과 광각 효과는 왜 다르게 나왔을까?
DALL·E는 문장 안에 들어 있는 low-angle, wide-lens 같은 단어를 문맥상 자연스럽게 반영해.
얼굴을 아래에서 찍은 것처럼 연출하고, 코가 조금 튀어나오게 만드는 왜곡도 있어.
반면 ComfyUI는 이런 표현을 그냥 단어로만 이해해.
특별히 ControlNet이나 LoRA, IPAdapter 같은 기능으로 앵글을 강제로 주입하지 않으면, 그냥 정면 사진이 나와.
요즘 인터넷에 프롬프트가 넘쳐나지. “DALL·E 최강 프롬프트”, “ComfyUI 고퀄 팩트 정리”…
그런데 말이야, 그걸 아무 생각 없이 복붙해서 쓰면 어떤 일이 벌어지냐면
오늘처럼 남자 나올 줄 알았는데 여자 나오고, 광각을 줬는데 정면이 나오는 그런 일이 생기는 거야.
형은 비추다! 프롬프트 복사해 쓰는거..
그냥 따라 쓰지 마. 반드시 분석해라. 컴퓨터 그래픽을 하든, AI로 그림을 그리든 항상 분석하는 습관이 진짜 실력을 만들어.
형도 그래. 형도 너도 프로그래머가 아니잖아?
우린 코딩이니 알고리즘이니 그런 걸로 이해하면 안 돼.(뭐 도움이 않되는건 아니지만)
우린 무조건 '이미지' 관점에서 접근해야 해.
빛은 어떻게 떨어졌는지/ 얼굴은 어느 각도에서 그려졌는지 / 렌즈 왜곡이 있는지 / 광원은 따뜻한지, 차가운지 / 이런 걸 눈으로 분석할 줄 알아야 해.
분석력이 곧 프롬프트 실력이다 .프롬프트 잘 쓴다는 건 결국 ‘내가 원하는 그림’을 말로 설계할 수 있다는 뜻이야.
그런데 그 설계의 시작이 뭔 줄 알아?
‘분석’이다
왜 이 얼굴이 이렇게 나왔을까?
왜 배경 색이 이렇게 변했을까?
왜 앵글이 반영되지 않았을까?
이런 질문을 스스로 던지고,
그걸 풀어가는 힘이 있어야 .남이 쓴 프롬프트를 내 걸로 바꿀 수 있어.
“프롬프트는 따라쓰는 게 아니라, 해석해서 내 걸로 만드는 거야.”
그래픽 디자이너는 말로 그리는 사람이야.
보는 눈과 말하는 입이 동시에 트여야, AI랑 그림 대화를 할 수 있지.
말 나온김에 다음 포스트에서는 이번 내용을 가지고 분석하는 시간을 가져보자. 화이팅~!
'MucKOO's ComfyUI 바이블 > #ComfyUI Advanced #' 카테고리의 다른 글
프롬프트를 해부하라: 그림을 말로 푸는 기술 (0) | 2025.05.09 |
---|---|
ComfyUI,Text2image (0) | 2025.04.21 |