Linux中國

正則表達式的分組和數字

大約一周前,我在編輯一個程序時想要更改一些變數名。我之前認為這將是一個簡單的正則表達式查找/替換。只是這沒有我想像的那麼簡單。

變數名為 a10v10x10,我想分別將它們改為 a30v30x30。我想到使用 BBEdit 的查找窗口並輸入:

![Mistaken BBEdit replacement pattern](/data/attachment/album/201903/06/202409pe33ejxexwl7emj3.png "Mistaken BBEdit replacement pattern")

我不能簡單地 30 替換為 10,因為代碼中有一些與變數無關的數字 10。我認為我很聰明,所以我不想寫三個非正則表達式替換,a10v10x10,每個一個。但是我卻沒有注意到替換模式中的藍色。如果我這樣做了,我會看到 BBEdit 將我的替換模式解釋為「匹配組 13,後面跟著 0,而不是」匹配組 1,後面跟著 30,後者是我想要的。由於匹配組 13 是空白的,因此所有變數名都會被替換為 0

你看,BBEdit 可以在搜索模式中匹配多達 99 個分組,嚴格來說,我們應該在替換模式中引用它們時使用兩位數字。但在大多數情況下,我們可以使用 19 而不是 19,因為這沒有歧義。換句話說,如果我嘗試將 a10v10x10 更改為 azvzxz,那麼使用 1z的替換模式就可以了。因為後面的 z 意味著不會誤解釋該模式中 1

因此,在撤消替換後,我將模式更改為這樣:

![Two-digit BBEdit replacement pattern](/data/attachment/album/201903/06/202410e4cjkw664r3wpmqi.png "Two-digit BBEdit replacement pattern")

它可以正常工作。

還有另一個選擇:命名組。這是使用 var 作為模式名稱:

![Named BBEdit replacement pattern](/data/attachment/album/201903/06/202411v8q8i9ztjjfjwzd4.png "Named BBEdit replacement pattern")

我從來都沒有使用過命名組,無論正則表達式是在文本編輯器還是在腳本中。我的總體感覺是,如果模式複雜到我必須使用變數來跟蹤所有組,那麼我應該停下來並將問題分解為更小的部分。

順便說一下,你可能已經聽說 BBEdit 正在慶祝它誕生25周年。當一個有良好文檔的應用有如此長的歷史時,手冊的積累能讓人愉快地回到過去的日子。當我在 BBEdit 手冊中查找命名組的表示法時,我遇到了這個說明:

![BBEdit regex manual excerpt](/data/attachment/album/201903/06/202414i07r9rx97x242961.png "BBEdit regex manual excerpt")

BBEdit 目前的版本是 12.5。第一次出現於 2001 年的 V6.5。但手冊希望確保長期客戶(我記得是在 V4 的時候第一次購買)不會因行為變化而感到困惑,即使這些變化幾乎發生在二十年前。

via: https://leancrew.com/all-this/2019/02/regex-groups-and-numerals/

作者:Dr.Drang 選題:lujun9972 譯者:geekpi 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國