스트라 AI 더빙/자막 소개 영상 살펴보기 👋
logo
|
Blog
  • 홈페이지
  • 유튜브
무료로 체험하기
스트라 사용법

스트라 AI 더빙 작업 영역 완전 정복: AI 목소리 톤과 감정 세밀하게 조정하기

스트라(Stra.ai)에서 AI 목소리 퍼포먼스를 디렉팅하는 방법. 보이스 디렉팅 필드, 톤 변환 버튼, Gemini TTS로 자연스럽고 표현력 있는 더빙 결과물을 얻는 프롬프트 작성법을 알아보세요.
Yo
Yongho Kim
Mar 31, 2026
스트라 AI 더빙 작업 영역 완전 정복: AI 목소리 톤과 감정 세밀하게 조정하기
Contents
세 개의 열보이스 디렉팅 프롬프트 작성하는 법오디오 생성 및 재생성톤 변환 버튼ElevenLabs vs Gemini TTS다음에 할 것

기술적으로 정확한 더빙을 만드는 건 어렵지 않아요. 자연스럽고 표현력 있으며 원본 퍼포먼스의 감정에 딱 맞는 더빙을 만들려면 조금 더 세심한 디렉팅이 필요해요. 이 가이드에서는 AI 목소리가 실제로 어떻게 들리는지에 영향을 주는 더빙 작업 영역의 모든 것, 보이스 디렉팅 필드, 톤 변환 버튼, 그리고 결과를 내는 프롬프트 작성법을 다뤄요 😊


세 개의 열

작업 영역의 모든 대화 세그먼트에는 세 개의 열이 있어요.

왼쪽 열은 소스로, 원본 언어 전사본이에요.

가운데 열은 번역으로, AI가 소리 내어 읽을 텍스트예요.

오른쪽 열은 보이스 디렉팅 필드예요. AI에게 그 줄을 어떻게 말해야 하는지, 무슨 말을 할지가 아니라 어떻게 말할지를 알려주는 곳이에요.

보이스 디렉팅 필드는 Gemini TTS를 기반으로 해요. 사람 배우에게 브리핑하는 것처럼 자연어 지시에 반응해요.


보이스 디렉팅 프롬프트 작성하는 법

보이스 디렉팅 필드는 일반 언어를 받아들여요. 특별한 문법이 필요 없어요. 배우에게 원하는 것을 말하듯이 써주세요.

유용한 시작 템플릿이에요.

"[감정 또는 태도]한 방식으로 말해주세요."

그리고 위에 구체적인 내용을 덧붙이세요.

"흥분되고 약간 숨이 찬 방식으로 말해주세요. 빠른 템포로, 속보를 전하는 것처럼."

"차분하고 권위 있는 방식으로 말해주세요. 천천히 신중하게, 다큐멘터리 내레이터처럼."

"비웃는 듯 깔보는 방식으로 말해주세요. 지루하지만 날카롭게."

"졸린 듯이, 반쯤 잠든 것처럼 말해주세요. 문장 끝에서 흐려지는 느낌으로."

"아무렇지 않게, 완전히 무관심하게 말해주세요."

Gemini TTS가 프롬프트를 해석하는 방식에 대해 알아두면 좋은 몇 가지예요.

크고 강한 딜리버리에는 "소리지르다(shout)"를 사용하세요. "비명지르다(scream)"보다 모델이 더 안정적으로 반응해요.

페이싱은 명시적인 지시에 잘 반응해요. "빠르게 말해주세요"와 "천천히 말해주세요" 모두 그대로 작동해요. 맥락을 설명할 수도 있어요. "시간이 촉박한 것처럼 말해주세요" 또는 "어린이에게 설명하는 것처럼 말해주세요."

감정은 쌓여요. 하나의 프롬프트에 여러 특성을 조합할 수 있고 모델이 균형을 맞추려고 시도해요. "따뜻하지만 전문적으로" 또는 "흥분되지만 절제되게" 모두 잘 작동해요.

지시가 구체적이고 일관성이 있을수록 결과가 더 좋아요. "자연스럽게 들려주세요" 같은 모호한 프롬프트보다 "친구를 만나 근황을 나누는 것처럼 대화체로 말해주세요" 같은 구체적인 프롬프트가 모델에게 더 많은 정보를 줘요.


오디오 생성 및 재생성

세그먼트의 번역과 보이스 디렉션을 설정했다면, 작업 영역 하단 화자 패널의 더빙 생성 버튼을 클릭하세요. AI가 해당 세그먼트의 오디오를 생성해요.

결과가 마음에 들지 않으면 보이스 디렉팅 필드를 조정하고 다시 생성하세요. 매 생성마다 새로운 테이크가 나와요. 디렉션을 설정한 다음 작업 영역 오른쪽 상단의 선택 항목 생성을 사용해서 여러 세그먼트를 한 번에 생성할 수도 있어요.

톤은 맞는데 세그먼트 간에 목소리가 약간 불안정하거나 일관성이 없다면, 디렉션을 바꾸지 않고 다시 생성해보세요. 생성 간의 작은 변이는 정상이고 새로 시도하면 해결되는 경우가 많아요.


톤 변환 버튼

톤 변환 버튼은 작업 영역 오른쪽 상단, 선택 항목 생성 버튼 옆에 있어요. 오디오 생성 전에 번역 텍스트 자체에 말투 스타일 변환을 적용해서 쓰여진 단어들의 격식과 톤을 바꿔줘요.

톤 변환을 클릭하면 스타일 옵션 패널이 열려요. 스트라는 한국어 워크플로우를 위해 만들어진 서비스이기 때문에 기본으로 표시되는 스타일은 한국어예요. 기본 프리셋에는 격식체 존댓말, 나레이션체, 대화체 인터뷰체가 포함되어 있어요.

패널 하단의 스타일 관리를 클릭해서 직접 커스텀 스타일을 추가할 수 있어요. 이름을 정하고 일반 언어로 변환 지시를 작성하면 돼요. 예를 들면:

공식적인 대상을 위한 스페인어 콘텐츠라면 "모든 것을 격식체 USTED 호칭으로 바꿔주세요."

일본어 또는 한국어 콘텐츠라면 "정중한 격식체로 변환해주세요."

젊은 스페인어 시청자를 대상으로 한 콘텐츠라면 "전체적으로 비격식체 tu 호칭을 사용해주세요."

단어는 기술적으로 맞더라도 직접 번역이 목표 시청자에게 잘못된 말투로 나올 수 있는, 여러 수준의 격식이나 존댓말 체계가 있는 언어에 특히 유용해요.


ElevenLabs vs Gemini TTS

프로젝트를 만들 때 선택한 보이스 모델이 어떤 엔진이 오디오를 생성하는지를 결정해요.

ElevenLabs를 선택했다면, 보이스 디렉팅 필드는 여전히 표시되지만 퍼포먼스는 디렉션 텍스트보다 보이스 클론에 의해 더 많이 형성돼요. ElevenLabs는 원본 화자의 목소리 캐릭터와 정체성을 유지하는 데 탁월해요.

Gemini TTS를 선택했다면, 보이스 디렉팅 필드가 완전히 효과를 발휘해요. Gemini TTS는 자연어 퍼포먼스 디렉션에 반응하도록 만들어졌고 톤, 페이싱, 감정, 딜리버리 스타일에 대한 정밀한 제어권을 줘요. 프로젝트에서 퍼포먼스에 대한 디렉팅 제어가 중요하다면 Gemini TTS가 올바른 선택이에요.


다음에 할 것

번역이 작성되고, 보이스 디렉션이 설정됐고, 오디오가 생성됐어요. 다음 단계는 완성된 프로젝트를 내보내는 거예요.

  • 더빙된 영상과 오디오 트랙 내보내기 → 고품질 내보내기 가이드

  • 타임라인과 화자 트랙 관리 복습하기 → 더빙 타임라인 가이드

  • 전체 에디터 개요로 돌아가기 → AI 더빙 에디터 완전 정복

  • 모든 단축키 한눈에 보기 → AI 더빙 단축키 가이드

  • → 다음으로: 고품질 내보내기 가이드

Share article

AI 더빙/자막 - 스트라

RSS·Powered by Inblog