머릿속엔 캐릭터가 분명히 있다. 우리 가게 마스코트, 브랜드 챗봇 얼굴, 내 게임 속 몬스터. 그런데 종이에 그려 보면 늘 어딘가 어설프다. 외주를 맡기자니 한 컷에 수십만 원이고, 시안이 오갈 때마다 얼굴이 조금씩 달라진다. 결국 캐릭터는 머릿속에만 남는다. 이 답답함을 푸는 게 캐릭터 레퍼런스 실사화 프롬프트다. 삐뚤빼뚤한 손그림 한 장이면 충분하다. 그 스케치를 바로 쓸 수 있는 리얼한 캐릭터 프로필로 바꿔 준다.

위 이미지가 바로 그 결과다. 아이가 크레용으로 그린 듯한 헤드폰 쓴 동그란 캐릭터 한 장을 넣었더니, 털 질감과 표정까지 살아 있는 마스코트 프로필이 나왔다. 원본의 정체성은 그대로 두고 완성도만 끌어올린다. 이게 핵심이다.
캐릭터 레퍼런스 실사화, 무엇을 해주나
이 템플릿이 하는 일은 단순하다. 첨부한 레퍼런스 이미지 한 장을 분석해서, 세로 프로필 형태의 리얼한 캐릭터 컷으로 변환한다. 스케치든 러프한 일러스트든 상관없다. 실루엣, 얼굴 정체성, 의상 단서, 포즈의 분위기, 종족 특징 같은 핵심 요소를 원본에서 읽어 그대로 가져온다. 대신 종이 질감이나 워터마크, 서명 같은 부수적인 흔적은 버린다. 남는 건 ‘내가 의도한 캐릭터’다.
왜 프로필 형태일까. 캐릭터가 가장 많이 쓰이는 자리가 프로필이기 때문이다. 챗봇 아바타, 튜터 카드, SNS 프로필, 굿즈 메인컷은 전부 상반신 중심이다. 그래서 템플릿은 머리와 상체가 또렷하게 들어오는 세로 구도를 기본값으로 잡아 둔다. 얼굴이 잘리거나 중요한 부위가 화면 밖으로 나가지 않게 가운데로 정렬한다. 나오는 즉시 어디든 끼워 넣을 수 있는 완성형 자산이라는 뜻이다.
레퍼런스 충실도, 캐릭터 실사화의 진짜 엔진
캐릭터 실사화가 어려웠던 건 ‘일관성’ 때문이다. 예전 AI는 같은 캐릭터를 다시 그려 달라고 하면 얼굴이 매번 달라졌다. 마스코트를 만들어도 두 번째 컷에서 다른 캐릭터가 돼 버리니, 브랜드 자산으로 쓸 수가 없었다. 이 문제가 풀린 게 최근의 가장 큰 변화다.
지금 모델들은 레퍼런스 이미지를 기준점으로 삼는다. 구글은 Gemini 2.5 Flash Image 공식 가이드에서, 텍스트만으로는 불가능한 정체성 유지를 레퍼런스 이미지로 해결한다고 설명한다. 구글 AI 개발자 문서에 따르면 한 번에 최대 14장까지 레퍼런스를 넣어 스타일과 캐릭터 일관성을 잡을 수 있다. 손그림 한 장만 있어도 캐릭터의 뼈대가 고정된다는 얘기다.
그래서 이 템플릿은 ‘없는 캐릭터를 지어내는’ 도구가 아니다. ‘있는 캐릭터를 완성하는’ 도구다. 어도비도 파이어플라이 스케치 변환 기능에서 스케치를 토대로 형태와 색을 입혀 의도에 가까운 결과를 만든다고 말한다. 흐릿한 아이디어를 운에 맡기지 않고, 내가 그린 형태 위에서 디테일만 채우는 방식이다.
변수는 네 가지만 열려 있다. 캐릭터 타입은 인간형과 몬스터형 중에 고른다. 인간형은 두개골 구조와 눈 위치, 손, 피부 질감까지 사람답게 잡고, 몬스터형은 골격 논리와 관절, 무게중심이 어긋나지 않는 ‘진짜 있을 법한’ 생명체로 설계한다. 렌더 스타일은 실사 라이브액션 사진과 고급 3D 렌더 중에 선택한다. 배경은 깔끔한 스튜디오부터 교실, 판타지 공간, 시네마틱 그라데이션까지 고른다. 마지막으로 정체성 메모에 연령대·분위기·역할·의상을 적으면 캐릭터의 성격이 또렷해진다.
1인 크리에이터·소규모 비즈니스를 위한 시나리오별 프롬프트
이제 실전이다. 막연히 “리얼하게 만들어 줘”라고 던지는 것과, 변수를 채워 주는 것의 차이를 보자.
손그림 캐릭터를 브랜드 마스코트로
가장 강력한 쓰임은 마스코트다. 종이에 대충 그린 캐릭터, 혹은 아이가 그린 그림 한 장을 브랜드 얼굴로 승격시킨다. 위에서 본 오렌지 마스코트가 아래 프롬프트로 나온 결과다.
레퍼런스: 헤드폰 쓴 동그란 캐릭터 손그림 1장
캐릭터_타입: 몬스터(친근한 크리처)
렌더_스타일: 고급 3D 렌더
배경: 미니멀 그라데이션 배경(웜톤)
분위기: 활기차고 호기심 가득
정체성_메모: 둥근 몸, 부드러운 털 질감, 큰 눈, 오디오/음악 브랜드 마스코트, 따뜻한 주황 톤
원본의 ‘헤드폰’과 ‘동그란 실루엣’은 그대로 살리고, 질감과 표정만 입혔다. 카페 굿즈, 음악 채널 프로필, 앱 아이콘으로 바로 쓸 수 있다. 같은 캐릭터로 표정과 포즈를 늘리고 싶다면 캐릭터 표정 시트 프롬프트 가이드가 가장 가까운 짝이다. 기준 컷 하나만 정해 두면 이모티콘·스티커까지 한 판으로 확장된다.
강사·전문가 챗봇을 위한 튜터 아바타
두 번째는 사람 캐릭터다. 온라인 강의나 학습 챗봇을 운영한다면, 신뢰감 있는 튜터 얼굴이 필요하다. 실존 인물 사진 대신, 콘셉트 스케치나 러프 일러스트를 넣어 가상의 강사 프로필을 만든다.
레퍼런스: 태블릿을 든 인물 러프 스케치 1장
캐릭터_타입: 인간(20대 후반 여성 강사)
렌더_스타일: 실사 라이브액션 사진
배경: 부드러운 교실/학습 공간
분위기: 차분하고 지적임
정체성_메모: 따뜻한 미소, 단정한 차림, 태블릿 소지, 친근한 멘토 느낌

스케치 속 ‘태블릿 든 인물’이라는 정보만으로 일관된 튜터 프로필이 나왔다. 챗봇 프로필, 강의 썸네일, 강사 소개 카드에 그대로 쓴다. 이렇게 만든 얼굴에 어울리는 말투와 페르소나를 설계하는 원리는 챗봇 파인 튜닝 가이드에서 더 깊이 다룬다. 얼굴과 성격이 맞물려야 진짜 캐릭터가 된다.
게임·IP를 위한 리얼 몬스터 컨셉
세 번째는 창작자용이다. 인디 게임이나 웹소설, 자체 IP를 준비한다면 머릿속 몬스터를 눈에 보이는 형태로 고정해야 한다. 러프한 컨셉 스케치를 넣으면 ‘있을 법한’ 생명체로 설계해 준다.
레퍼런스: 외눈 다크 크리처 컨셉 스케치 1장
캐릭터_타입: 몬스터(외눈 생명체)
렌더_스타일: 고급 3D 렌더
배경: 깔끔한 중립 그라데이션 스튜디오
분위기: 차분하고 지적임
정체성_메모: 큰 외눈, 매끈한 푸른 피부, 호기심 어린 표정, 친근한 인상의 외계 생명체

외눈이라는 비현실적인 설정도 골격과 무게중심이 어긋나지 않게 잡아 준다. 게임 캐릭터 시안, IP 설정집, 굿즈 메인컷으로 쓸 수 있다. 같은 캐릭터를 정면·측면·후면 설계도로 확장하고 싶다면 캐릭터 3면도 프롬프트 가이드와 묶어 모델시트까지 한 번에 정리하면 된다.
실전 팁, 레퍼런스 품질이 결과를 결정한다
이 템플릿의 힘은 레퍼런스에 있다. 그래서 넣는 그림의 품질이 곧 결과의 품질이다. 몇 가지만 지키면 적중률이 확 올라간다.
- 레퍼런스 해상도: 너무 흐릿한 그림은 형태를 잘못 읽는다. 1024픽셀 안팎의 또렷한 그림이 안전하고, 512픽셀 아래로는 피하는 게 좋다.
- 형태 우선: 색칠보다 실루엣이 중요하다. 헤드폰, 외눈, 태블릿처럼 캐릭터를 정의하는 핵심 형태가 분명해야 모델이 그걸 살린다.
- 정체성 메모를 구체적으로: 연령·역할·분위기를 적을수록 캐릭터가 또렷해진다. “친근한 강사”보다 “20대 후반, 따뜻한 미소, 차분한 멘토”가 훨씬 일관된다.
- 타입과 스타일을 분리해서 생각: 같은 스케치라도 인간형/몬스터형, 실사/3D 조합에 따라 완전히 다른 결과가 나온다. 용도에 맞춰 골라야 한다.
한 가지만 기억하자. 캐릭터를 처음부터 글로 묘사하려 들지 말자. 형태는 그림으로 넣고, 글로는 분위기와 역할만 보태는 게 가장 빠르다. 캐릭터 프롬프트 작성의 기본기가 더 궁금하다면 캐릭터 생성 프롬프트 작성법을 먼저 보면 흐름이 잡힌다.
오늘 머릿속 캐릭터, 프로필 한 장으로 꺼내 보자
캐릭터 레퍼런스 실사화의 진짜 가치는 ‘내 캐릭터’를 운에 맡기지 않는다는 데 있다. 그림 실력도, 외주 예산도 없이 머릿속 마스코트와 튜터, 몬스터를 바로 쓸 수 있는 프로필로 꺼낼 수 있다는 뜻이다. 책상 서랍에 잠든 스케치 한 장을 골라 Gen Studio에서 이 템플릿으로 프로필을 만들어 보자. 머릿속에만 있던 캐릭터가 처음으로 눈앞에 선다.
참고 자료
- Google Developers Blog, "How to prompt Gemini 2.5 Flash Image Generation for the best results"
- Google AI for Developers, "Image generation with Gemini (Nano Banana)"
- Adobe, "Sketch to image – Firefly"