Linux中國

如何在 Linux 中編輯字幕

從閉路字幕數據中提取字幕

大概在 2012、2013 年我開始了解到有一款叫做 CCEextractor 的工具。隨著時間的推移,它已經成為我必不可少的工具之一,尤其是當我偶然發現一份內含有字幕的媒體文件。

CCExtractor 負責解析視頻文件以及從 閉路字幕 closed captions 數據中產生獨立的字幕文件。

CCExtractor 是一個跨平台的、自由開源工具。自它形成的那年起該工具已經成熟了不少而如今已成為 GSOC 和谷歌編碼輸入的一部分。

簡單來說,這個工具基本上是一系列腳本,這些腳本以一種順序方式一個接著一個地給你提供提取到的字幕。

你可以按照本頁的 CCExtractor 安裝指南進行操作。

若安裝後你想從媒體文件中提取字幕,請按以下步驟操作:

ccextractor <path_to_video_file>

該命令將會輸出以下內容:

$ ccextractor $something.mkv
CCExtractor 0.87, Carlos Fernandez Sanz, Volker Quetschke.
Teletext portions taken from Petr Kutalek&apos;s telxcc
-----------------------------------------------------------------------Input: $something.mkv
[Extract: 1] [Stream mode: Autodetect]
[Program : Auto ] [Hauppage mode: No] [Use MythTV code: Auto]
[Timing mode: Auto] [Debug: No] [Buffer input: No]
[Use pic_order_cnt_lsb for H.264: No] [Print CC decoder traces: No]
[Target format: .srt] [Encoding: UTF-8] [Delay: 0] [Trim lines: No]
[Add font color data: Yes] [Add font typesetting: Yes]
[Convert case: No] [Video-edit join: No]
[Extraction start time: not set (from start)]
[Extraction end time: not set (to end)]
[Live stream: No] [Clock frequency: 90000]
[Teletext page: Autodetect]
[Start credits text: None]
[Quantisation-mode: CCExtractor&apos;s internal function]
--------------------------------------------------------------Opening file: $something.mkv
File seems to be a Matroska/WebM container
Analyzing data in Matroska mode

Document type: matroska
Timecode scale: 1000000
Muxing app: libebml v1.3.1 + libmatroska v1.4.2
Writing app: mkvmerge v8.2.0 (&apos;World of Adventure&apos;) 64bit
Title: $something

Track entry:
    Track number: 1
    UID: 1
    Type: video
    Codec ID: V_MPEG4/ISO/AVC
    Language: mal
    Name: $something

Track entry:
    Track number: 2
    UID: 2
    Type: audio
    Codec ID: A_MPEG/L3
    Language: mal
    Name: $something

Track entry:
    Track number: 3
    UID: somenumber
    Type: subtitle
    Codec ID: S_TEXT/UTF8
    Name: $something
 99%  |  144:34
100%  |  144:34
Output file: $something_eng.srt
Done, processing time = 6 seconds
Issues? Open a ticket here
https://github.com/CCExtractor/ccextractor/issues

它會大致瀏覽媒體文件。在這個例子中,它發現該媒體文件是馬拉雅拉姆語言(mal)並且格式是 .mkv。之後它將字幕文件提取出來,命名為源文件名並添加「_eng」後綴。

CCExtractor 是一款用來增強字幕功能和字幕編輯的優秀工具,我將在下一部分對它進行介紹。

趣味閱讀:在 vicaps 有一份有趣的字幕提要,它講解和分享為何字幕對我們如此重要。對於那些對這類話題感興趣的人來說,這裡面也有許多電影製作的細節。

用 SubtitleEditor 工具編輯字幕

你大概意識到大多數的字幕都是 .srt 格式 的。這種格式的優點在於你可以將它載入到文本編輯器中並對它進行少量的修改。

當進入一個簡單的文本編輯器時,一個 srt 文件看起來會是這個樣子:

1
00:00:00,959 --> 00:00:13,744
"THE CABINET
OF DR. CALIGARI"

2
00:00:40,084 --> 00:01:02,088
A TALE of the modern re-appearance of an 11th Century Myth
involting the strange and mysterious influence
of a mountebank monk over a somnambulist.

我分享的節選字幕來自於一部非常老的德國電影《卡里加里博士的小屋》(1920)。

Subtitleeditor 是一款非常棒的字幕編輯軟體。字幕編輯器可以用來設置字幕持續時間、與多媒體文件同步的字幕幀率以及字幕間隔時間等等。接下來我將在這分享一些基本的字幕編輯。

首先,以安裝 ccextractor 工具同樣的方式安裝 subtitleeditor 工具,使用你自己喜愛的安裝方式。在 Debian 中,你可以使用命令:

sudo apt install subtitleeditor

當你安裝完成後,讓我們來看一下在你編輯字幕時一些常見的場景。

調整幀率使其媒體文件同步

如果你發現字幕與視頻不同步,一個原因可能是視頻文件的幀率與字幕文件的幀率並不一致。

你如何得知這些文件的幀率呢,然後呢?為了獲取視頻文件的幀率,你可以使用 mediainfo 工具。首先你可能需要發行版的包管理器來安裝它。

使用 mediainfo 非常簡單:

$ mediainfo somefile.mkv | grep Frame
 Format settings                          : CABAC / 4 Ref Frames
 Format settings, ReFrames                : 4 frames
 Frame rate mode                          : Constant
 Frame rate                               : 25.000 FPS
 Bits/(Pixel*Frame)                       : 0.082
 Frame rate                               : 46.875 FPS (1024 SPF)

現在你可以看到視頻文件的幀率是 25.000 FPS 。我們看到的另一個幀率則是音頻文件的幀率。雖然我可以分享為何在視頻解碼和音頻解碼等地方會使用特定的 fps,但這將會是一個不同的主題,與它相關的歷史信息有很多。

下一個問題是解決字幕文件的幀率,這個稍微有點複雜。

通常情況下,大多數字幕都是壓縮格式的。將.zip 歸檔文件和字幕文件(以 XXX.srt 結尾)一起解壓縮。除此之外,通常還會有一個同名的 .info 文件,該文件可能包含字幕的幀率。

如果不是,那麼通常最好去某個站點並從具有該幀速率信息的站點下載字幕。對於這個特定的德文文件,我使用 Opensubtitle.org 來找到它。

正如你在鏈接中所看到的,字幕的幀率是 23.976 FPS 。很明顯,它不能與幀率為 25.000 FPS 的視頻文件一起很好地播放。

在這種情況下,你可以使用字幕編輯工具來改變字幕文件的幀率。

按下 CTRL+A 選擇字幕文件中的全部內容。點擊 「Timings -> Change Framerate」 ,將 23.976 fps 改為 25.000 fps 或者你想要的其他幀率,保存已更改的文件。

synchronize frame rates of subtitles in Linux

改變字幕文件的起點

有時以上的方法就足夠解決問題了,但有時候以上方法並不足夠解決問題。

在幀率相同時,你可能會發現字幕文件的開頭與電影或媒體文件中起點並不相同。

在這種情況下,請按以下步驟進行操作:

按下 CTRL+A 鍵選中字幕文件的全部內容。點擊 「Timings -> Select Move Subtitle」 。

Move subtitles using Subtitle Editor on Linux

設定字幕文件的新起點,保存已更改的文件。

Move subtitles using Subtitle Editor in Linux

如果你想要時間更精確一點,那麼可以使用 mpv 來查看電影或者媒體文件並點擊進度條(可以顯示電影或者媒體文件的播放進度),它也會顯示微秒。

通常我喜歡精準無誤的操作,因此我會試著儘可能地仔細調節。相較於人類的反應時間來說,MPV 中的反應時間很精確。如果我想要極其精確的時間,那麼我可以使用像 Audacity 之類的東西,但是那是另一種工具,你可以在上面做更多的事情。那也將會是我未來博客中將要探討的東西。

調整字幕間隔時間

有時,兩種方法都採用了還不夠,甚至你可能需要縮短或增加間隔時間以使其與媒體文件同步。這是較為繁瑣的工作之一,因為你必須單獨確定每個句子的間隔時間。尤其是在媒體文件中幀率可變的情況下(現已很少見,但你仍然會得到此類文件)

在這種設想下,你可能因為無法實現自動編輯而不得不手動的修改間隔時間。最好的方式是修改視頻文件(會降低視頻質量)或者換另一個更高質量的片源,用你喜歡的設置對它進行轉碼 。這又是一重大任務,以後我會在我的一些博客文章上闡明。

總結

以上我分享的內容或多或少是對現有字幕文件的改進。如果從頭開始,你需要花費大量的時間。我完全沒有分享這一點,因為一部電影或一個小時內的任何視頻材料都可以輕易地花費 4-6 個小時,甚至更多的時間,這取決於字幕員的技巧、耐心、上下文、行話、口音、是否是以英語為母語的人、翻譯等,所有的這些都會對字幕的質量產生影響。

我希望自此以後你會覺得這件事很有趣,並將你的字幕處理的更好一點。如果你有其他想要補充的問題,請在下方留言。

via: https://itsfoss.com/editing-subtitles

作者:Shirish 選題:lujun9972 譯者:chenmu-kk 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國