스트라 AI 더빙 타임라인 완전 정복: 다중 화자와 오디오 트랙 관리하기
더빙 타임라인은 프로젝트의 모든 오디오가 모여있는 곳이에요. 자막 타임라인이 하나의 웨이브폼을 보여주는 것과 달리, 더빙 타임라인은 각 화자별 채널과 배경 음악, 원본 오디오 전용 트랙이 수직으로 쌓여 표시돼요. 이 가이드에서 더빙 타임라인을 자신 있게 다루는 데 필요한 모든 것을 설명해드릴게요 😊
타임라인 위 툴바
타임라인 영역 상단에 다음 컨트롤들이 있어요.
재생 및 일시정지는 현재 재생 헤드 위치에서 재생을 시작하거나 멈춰요.
타임코드 필드는 현재 재생 헤드 위치를 보여줘요. 클릭해서 특정 타임코드를 직접 입력하면 영상의 그 지점으로 바로 이동해요. 스크롤 없이 정확한 순간으로 이동하는 가장 빠른 방법이에요.
세그먼트 추가는 현재 재생 헤드 위치에 선택된 화자 채널에 새로운 빈 대화 세그먼트를 만들어요.
자르기는 현재 재생 헤드 위치와 겹치는 세그먼트를 두 개로 분리해요.
병합은 선택한 세그먼트를 다음 세그먼트와 합쳐요. 병합은 텍스트만 합쳐지는 거예요. 오디오는 자동으로 합쳐지지 않기 때문에 병합 후 더빙을 다시 생성해야 해요.
삭제는 선택한 세그먼트를 완전히 제거해요.
노트는 현재 재생 헤드 위치에 새 노트 입력창을 열어요. 노트 시스템 전체 설명은 AI 더빙 개요 가이드를 참고하세요.
되돌리기 및 다시 실행은 편집 기록을 앞뒤로 이동해요.
오디오 채널 구성
타임라인은 수평으로 쌓인 채널들로 나뉘어요. 각 채널은 프로젝트의 별도 오디오 레이어예요.
BGM은 배경 음악과 효과음 트랙이에요. 프로젝트 설정 중에 처리된 목소리가 제거된 오디오예요.
원본 오디오는 번역 전의 소스 목소리 트랙이에요. 편집 중 참고용으로 사용해요.
화자 채널은 이 두 트랙 아래에 있어요. 영상에서 감지된 각 화자가 자신만의 채널을 가지고, 색상으로 구분되어 화자 1, 화자 2, 화자 3 등으로 표시돼요. 화면에 다 안 보일 만큼 화자가 많다면 타임라인을 아래로 스크롤하세요.
오디오 예외 트랙은 화자 0으로 표시되는 특별한 채널이에요. 최종 내보내기에서 보존하고 싶은 원본 오디오 세그먼트를 보내는 곳이에요.
새 대화 세그먼트 추가하기
AI 처리에서 잡히지 않은 대화 줄을 추가하려면 세 단계로 하면 돼요.
첫째, 새 세그먼트를 추가하고 싶은 타임라인 위치로 이동하세요. 타임코드 필드에 정확한 위치를 입력하거나 타임라인을 직접 클릭해서 재생 헤드를 이동하세요.
둘째, 작업 영역 하단 화자 패널에서 올바른 화자가 선택되어 있는지 확인하세요. 새 세그먼트는 해당 화자의 채널에 생성돼요.
셋째, 툴바의 더하기 버튼을 클릭하세요. 선택된 화자의 채널 재생 헤드 위치에 새 빈 세그먼트가 생겨요.
원본 언어를 입력할 필요 없어요. 작업 영역의 번역 열에 바로 입력하면 AI가 그 텍스트를 화자의 클론 목소리로 변환해줘요. 소스 언어도 포함하고 싶다면 소스 열에 입력하고 화살표 버튼으로 자동 번역한 다음 더빙을 생성하면 돼요.
타임라인 세그먼트의 점 세 개 메뉴
타임라인의 세그먼트 블록에 있는 점 세 개를 클릭하면 타임라인 뷰 전용 두 가지 옵션이 있는 메뉴가 열려요.
더빙 오디오에 추가는 해당 세그먼트를 오디오 예외 트랙으로 이동시켜요. AI가 설득력 있게 재현할 수 없는 웃음, 비명, 감정적인 소리 같이 원본 오디오를 최종 내보내기에서 보존하고 싶을 때 사용하세요. 프로젝트를 내보내면 이 오디오는 AI 보이스오버로 교체되는 대신 원본 소스에서 그대로 보존돼요.
이 세그먼트 다시 전사하기는 AI에게 그 오디오 구간을 다시 들어서 새로운 전사와 번역을 생성해달라고 요청해요. 몇 초밖에 안 걸려요. 새 전사가 나타나면 검토 후 평소처럼 더빙을 생성하면 돼요.
화자 채널 간 세그먼트 이동하기
타임라인에서 대화 세그먼트를 한 화자 채널에서 다른 화자 채널로 직접 드래그할 수 있어요. 이렇게 하면 해당 세그먼트의 화자 할당이 드롭한 채널에 맞게 자동으로 업데이트돼요. AI가 대사를 잘못된 화자에게 할당했을 때 수정하는 데 사용하세요.
화자 채널 컨트롤
각 화자 채널의 타임라인 왼쪽에 컨트롤이 있어요.
화자 번호 배지가 채널을 식별해줘요.
S를 클릭하면 해당 트랙이 솔로로 설정되어 다른 모든 채널이 음소거되고 그 화자만 들을 수 있어요.
채널 레이블 옆 점 세 개를 클릭하면 세 가지 옵션이 있는 메뉴가 열려요. 화자 설정으로 화자의 목소리를 구성하고, 트랙 오디오 생성으로 해당 채널의 모든 세그먼트를 한 번에 재생성하고, 트랙 오디오 다운로드로 해당 화자의 오디오만 파일로 내보낼 수 있어요. 전체 트랙과 관련된 모든 대화를 삭제하는 삭제 옵션도 있어요. 이 작업은 취소할 수 없기 때문에 확인 팝업이 먼저 나타나요.
타임라인 채널 목록 맨 아래의 더하기 버튼으로 새 화자 채널을 추가할 수 있어요. 작업 영역 하단 화자 패널의 목록에서도 화자를 추가할 수 있어요.
세그먼트 표시와 시각화
타임라인의 각 세그먼트는 대화 텍스트, 초 단위 세그먼트 길이, 오디오의 웨이브폼 시각화를 보여줘요.
웨이브폼이 없고 "No TTS"가 표시된 세그먼트는 아직 오디오가 생성되지 않은 거예요.
크기 조정 핸들을 드래그해서 웨이브폼 시각화를 수직·수평으로 크기 조정할 수 있어요. 이건 표시 목적으로만 사용되고 오디오에는 영향을 주지 않아요.
타임라인에서 텍스트 세그먼트를 길게 만들어도 오디오가 길어지지는 않아요. 보이스 디렉팅 필드에 "천천히 말해주세요" 또는 "빠르게 말해주세요" 같은 지시를 포함하지 않는 한 AI는 텍스트를 자연스러운 속도로 읽어요. 텍스트를 늘리면 표시 시간이 늘어나지만, 박스를 줄이면 더 일찍 끝낼 수 있어요.
다음에 할 것
더빙 타임라인 전체를 이해했어요. 다음 단계는 내보내기 전에 각 세그먼트의 목소리 퍼포먼스를 세밀하게 조정하는 거예요.