커스텀 프롬프트의 힘: AI 번역 톤과 스타일 완전히 내 것으로 만들기
스트라(Stra.ai)의 번역 엔진은 문맥을 이해해요. 전체 스크립트를 먼저 읽고 번역하기 때문에 기본 기계 번역보다 이미 훨씬 자연스러워요. 그런데 커스텀 프롬프트 기능을 쓰면 한 단계 더 나아가서, AI에게 번역이 어떻게 들려야 하는지 정확하게 지시할 수 있어요. 이 가이드에서는 그게 어떻게 작동하는지, 각 설정이 실제로 무엇을 하는지, 그리고 처음 결과물부터 콘텐츠에 딱 맞게 나오려면 어떻게 함께 써야 하는지 설명해드릴게요 😊
두 가지 설정, 두 가지 역할
프롬프트로 들어가기 전에, 스트라에는 콘텐츠가 어떻게 들리는지에 영향을 주는 두 가지 별개의 설정이 있다는 걸 이해하는 게 도움이 돼요. 완전히 다른 역할을 해요.
번역 프롬프트는 번역된 글의 스타일을 제어해요. AI에게 단어를 어떻게 선택해야 하는지 알려줘요. 격식체인지 비격식체인지, 스포츠 전문 용어를 쓸지 캐주얼한 슬랭을 쓸지, 뉴스 앵커 말투인지 10대 대화체인지 같은 거예요. 서식이 아니라 단어 선택과 말투에 관한 설정이에요.
보이스 모델은 번역이 완료된 다음 AI가 그 글을 어떻게 읽어낼지를 제어해요. AI 더빙에만 적용돼요. 목소리가 차분한지 신나는지, 평탄한지 표현력이 풍부한지 같은 감정, 억양, 에너지에 영향을 줘요.
같은 파이프라인의 다른 단계에서 작동해요. 번역 프롬프트는 쓰여질 내용을 형성하고, 보이스 모델은 그걸 어떻게 수행할지를 형성해요.
번역 프롬프트, 단어 선택과 스타일 제어하기
번역 프롬프트 필드는 AI 자막과 AI 더빙 프로젝트 모두의 만들기 팝업에 나타나요. 선택 사항이에요. 비워두면 스트라가 특별한 스타일 없이 중립적이고 정확한 번역을 만들어줘요.
채워넣으면 AI에게 번역이 어떤 느낌이어야 하는지 브리핑을 주는 거예요. 글자 수 제한 없어요. 사람 번역가에게 브리핑하듯이 써주세요.
내장 스타일 프리셋
처음부터 직접 쓰기 싫다면 스트라에서 제공하는 다섯 가지 프리셋을 써보세요.
스포츠 생중계 해설. 높은 에너지, 빠른 템포, 스포츠 전문 용어와 해설자 표현. 경기 하이라이트, 스포츠 요약, 액션 콘텐츠에 적합해요.
캐주얼 드라마/예능 스타일. 자연스러운 일상 대화체, 감정 표현이 풍부하고 실제로 사람들이 말하는 방식. 예능 콘텐츠, 브이로그, 리얼리티쇼, 라이프스타일 영상에 잘 맞아요.
공식 뉴스 보도. 중립적이고 권위 있는 구조적인 문체. 다큐멘터리, 기업 영상, 교육 설명 영상, 신뢰감이 필요한 모든 콘텐츠에 적합해요.
10대/Z세대 스타일. 비격식체, 최신 슬랭, 편안한 말투. 소셜 플랫폼의 젊은 시청자를 대상으로 하는 콘텐츠에 좋아요.
어린이 친화적 스타일. 쉬운 어휘, 명확한 문장 구조, 따뜻하고 친근한 말투. 어린이 콘텐츠, 저연령 학습 자료, 가족 대상 영상에 적합해요.
직접 커스텀 프롬프트 작성하기
드롭다운에서 커스텀 프롬프트를 선택하면 텍스트 입력란이 열려요. 원하는 스타일을 간단히 설명해주세요. 번역가에게 메모를 남기듯이 쓰면 돼요. 구체적으로 쓸수록 결과물이 기대에 더 잘 맞아요.
잘 작동하는 프롬프트 예시 몇 가지예요:
"20대 중반 두 사람 사이의 캐주얼하고 친근한 말투를 사용해주세요. 친구에게 문자 보내듯 대화체로 자연스럽게."
"격식체로 번역해주세요. 기업 교육 영상이에요. 전문 용어를 사용하고 구어체 표현은 피해주세요."
"스포츠 해설자 말투를 사용해주세요. 높은 에너지, 현재 시제, 짧고 강렬한 문장."
"화자는 레시피를 설명하는 셰프예요. 요리 용어를 자연스럽게 사용하고 따뜻하고 설명적인 톤으로."
핵심은 관계, 맥락, 말투를 구체적으로 설명하는 거예요. "잘 번역해주세요"만 쓰는 게 아니라요. AI에게 더 많은 맥락을 줄수록 단어 선택이 더 정확해져요.
보이스 모델, 감정과 딜리버리 제어하기 (AI 더빙 전용)
번역이 완료되면 보이스 모델이 AI가 그걸 어떻게 수행할지를 결정해요. AI 더빙 프로젝트에만 적용되는 설정이에요. 두 가지 옵션이 있어요.
ElevenLabs. 보이스 클로닝이 포함된 자연스러운 보이스 생성. 더빙된 목소리가 원본 화자의 톤과 캐릭터에 최대한 가깝게 맞아야 할 때 적합해요. 개인 콘텐츠, 브이로그, 인터뷰, 목소리 정체성이 중요한 모든 콘텐츠에 잘 맞아요.
Gemini TTS. 감정과 톤 제어에 최적화되어 있어요. Gemini TTS를 선택하면 "목소리가 어떻게 들려야 하나요?"라는 별도의 필드가 나타나요. 여기서 단어가 아니라 딜리버리 방식을 지시하는 거예요.
Gemini TTS 보이스 디렉션 예시들:
"스포츠 해설자가 생중계를 하듯 높은 에너지로 말해주세요."
"다큐멘터리 내레이터처럼 차분하고 권위 있게 말해주세요."
"화가 나 있지만 억누르려고 노력하는 듯이. 통제된 표면 아래 긴장감이 느껴지게."
"긴장한 학생에게 무언가를 설명하는 선생님처럼 따뜻하고 격려하는 말투로."
두 가지를 함께 쓰는 법
가장 강력한 설정은 번역 프롬프트와 Gemini TTS 보이스 디렉션을 함께 쓰는 거예요. 하나는 쓰여질 내용을 형성하고, 다른 하나는 수행 방식을 형성해요.
예를 들어 스포츠 하이라이트 영상이라면 이렇게 쓸 수 있어요:
번역 프롬프트: "스포츠 해설자 말투. 높은 에너지, 현재 시제, 짧고 강렬한 문장."
보이스 디렉션: "생중계를 하는 해설자처럼. 흥분되고, 긴박하고, 긴장감이 고조되는 느낌."
기업 교육 영상이라면 이렇게 쓸 수 있어요:
번역 프롬프트: "공식적인 전문 언어. 슬랭 없이. 명확하고 교육적으로."
보이스 디렉션: "차분하고, 절제되고, 권위 있게. 프로세스를 설명하는 시니어 전문가처럼."
두 설정이 맞아떨어지면 결과물이 무작위적이 아니라 의도적인 느낌을 줘요.
에디터에서 모든 걸 조정할 수 있어요
첫 번째 결과물이 맘에 들지 않아도 걱정 없어요. 아무것도 고정된 게 없어요. 프로젝트가 처리되면 에디터에서 번역을 한 줄씩 수정할 수 있고, 오디오를 재생성하기 전에 보이스 디렉션도 각 라인별로 또는 전체적으로 조정할 수 있어요.
프로젝트 생성 시 설정한 프롬프트는 시작점일 뿐, 최종 결과가 아니에요. 더빙 설정의 "번역만 먼저 생성" 토글을 사용하면 보이스 생성을 시작하기 전에 번역을 검토하고 다듬을 수 있어요.