MKV 파일에서 HDMV PGS(SUP) 한글/영문 자막 파일 추출하고 SMI/SRT로 변환하기 (1)

in subtitle •  7 years ago  (edited)

"https://archive.is/fgH8v"에서 관련 정보를 찾을 수 있었다.

Subtitle Edit으로 MKV 파일에서 PGS(SUP) 자막파일 추출하고 SMI/SRT 변환하기 (1)

자막 편집 시 사용하는 Subtitle Edit을 이용해 MKV 파일에서 PGS(SUP) 한글/영문 자막을 추출할 수 있다.

한글도 OCR이 가능하다. 핵심만 요약하면 아래와 같다.

  1. https://github.com/SubtitleEdit/subtitleedit/releases/latest/ 에서 Subtitle Edit 최신 버전을 다운로드한다.

  2. 포터블 버전은 압축을 풀고, 설치 버전은 설치해 준다. 그 다음에 SubtitleEdit.exe를 실행시킨다.

  3. 좌측 상단의 메뉴에서 "File" >> "Import subtitle from Matroska file…"을 눌러서 MKV 파일을 연다.

  4. 그러면 자막이 있는 영상의 경우 원하는 언어의 자막 스트림을 선택할 수 있다. 선택해서 열어주자.

  5. Parsing 작업이 모두 끝나면, OCR method에서 OCR via Tesseract를 선택하자.

  6. 그 다음에 아래의 Language에서 원하는 언어를 선택하자. 필요한 언어가 없으면 "..."을 눌러 필요한 것을 다운로드하자.

  7. 필요에 따라 "Italic"이나 "Music Symbol"을 체크하고, 오른쪽의 Dictionary도 인식할 언어로 설정하자. 없거든 다운하면 된다.

  8. 그다음 아래의 "Start OCR"을 누르자. 만약 여기서 아래와 같은 오류가 나면, 다음 포스트(https://steemit.com/technology/@otgw/subtitle-edit-tesseract-command-line-ocr-engine)를 참조해 문제를 해결하자.

Tesseract command line ocr engine has stopped working

Tesseract command line ocr engine의 작동이 중지되었습니다

  1. OCR 인식 작업이 끝나면 OK를 눌러 작업을 완료하고, "File" >> "Save As…"를 눌러서 원하는 파일 형식으로 저장한다.
Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!