우리나라에서 자막 파일에 주로 사용되는 형식은 SAMI이다.

그런데, 이 포맷은 치명적인 문제들이 많다.

무엇보다도 HTML에 기반을 둔 포맷이라 표현하지 못하는 글자가 많다1.

게다가, 쓸데없는 태그2가 너무 많아 파일이 깔끔해보이지도 않는다.

그런 등의 이유로 개인적으로는 SRT를 더 선호했는데, 이번에 아예 SRT를 주력으로 하기로 했다.


자막 작업을 하면서 필요로 하던 기능들을 모아 SRT 자막을 손쉽게 조작할 수 있는 프로그램을 만들었다.

이 프로그램의 주요 기능은 아래와 같다.

– SRT 파일 교정: SRT 파일을 읽은 뒤 오류를 수정한 뒤 다시 기록하거나 시간을 조정함

– 자막 변환: SAMI/SSA/ASS 자막을 SRT로 변환, SRT 자막을 SAMI로 변환

– 텍스트 추출: SRT 자막에서 텍스트만 추출

– 텍스트 합치기: 기존의 SRT 자막의 시간 코드에 맞춰 텍스트 파일의 내용을 합침

조금 더 상세히 보면 기능들은 이렇다.

1. SRT 파일 교정

   – OCR 과정에서 따옴표가 잘못 인식된 경우나 I(i)를 l(L)로 잘못 인식된 경우를 수정

   – OCR 과정에서 숫자 사이에 불필요한 공백이 들어간 경우 수정

   – 시간 수정. 일괄적으로 더하거나 뺄 수도 있고, 영상과 fps 및 싱크를 맞추기 위해 일정 비율로 적용 가능

2. 자막 변환

   – SSA/ASS 자막을 지정하면 SRT로 변환함

   – SAMI 자막을 지정하면 SRT로 변환하며, 다중 언어 자막인 경우 별도의 파일로 생성

   – SRT 자막을 지정하면 SAMI로 변환하며, ANSI 포맷의 표준 자막과 UTF-8 유니코드 자막을 동시에 생성

   – 모든 경우에 원본 파일의 코드 페이지를 자동으로 인식하며, 적절히 인식해서 처리함

   – SRT를 생성할 때는 UTF-8 포맷으로 저장하므로 유니코드의 모든 문자를 표현 가능함

3. 텍스트 추출

   – 주로 자막 번역시 편리하게 적용할 수 있는 기능으로, 시간 정보를 제거하고 텍스트만 추출함

   – 번역 시에 이 텍스트 파일을 문단별로 번역하면 됨

4. 텍스트 합치기

   – 3번에서 추출한 텍스트 파일에 다시 시간 정보를 입히는 기능

   – 역시 자막 번역시 활용할 수 있는 기능임

이 프로그램은 아래 링크에서 다운받을 수 있다.

 SRTIER.ZIP

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다