正則表達式的分組和數字

大約一周前,我在編輯一個程序時想要更改一些變數名。我之前認為這將是一個簡單的正則表達式查找/替換。只是這沒有我想像的那麼簡單。
變數名為 a10
、v10
和 x10
,我想分別將它們改為 a30
、v30
和 x30
。我想到使用 BBEdit 的查找窗口並輸入:

我不能簡單地 30
替換為 10
,因為代碼中有一些與變數無關的數字 10
。我認為我很聰明,所以我不想寫三個非正則表達式替換,a10
、v10
和 x10
,每個一個。但是我卻沒有注意到替換模式中的藍色。如果我這樣做了,我會看到 BBEdit 將我的替換模式解釋為「匹配組 13,後面跟著 0
,而不是」匹配組 1,後面跟著 30
,後者是我想要的。由於匹配組 13 是空白的,因此所有變數名都會被替換為 0
。
你看,BBEdit 可以在搜索模式中匹配多達 99 個分組,嚴格來說,我們應該在替換模式中引用它們時使用兩位數字。但在大多數情況下,我們可以使用 1
到 9
而不是 1
到 9
,因為這沒有歧義。換句話說,如果我嘗試將 a10
、v10
和 x10
更改為 az
、vz
和 xz
,那麼使用 1z
的替換模式就可以了。因為後面的 z
意味著不會誤解釋該模式中 1
。
因此,在撤消替換後,我將模式更改為這樣:

它可以正常工作。
還有另一個選擇:命名組。這是使用 var
作為模式名稱:

我從來都沒有使用過命名組,無論正則表達式是在文本編輯器還是在腳本中。我的總體感覺是,如果模式複雜到我必須使用變數來跟蹤所有組,那麼我應該停下來並將問題分解為更小的部分。
順便說一下,你可能已經聽說 BBEdit 正在慶祝它誕生25周年。當一個有良好文檔的應用有如此長的歷史時,手冊的積累能讓人愉快地回到過去的日子。當我在 BBEdit 手冊中查找命名組的表示法時,我遇到了這個說明:

BBEdit 目前的版本是 12.5。第一次出現於 2001 年的 V6.5。但手冊希望確保長期客戶(我記得是在 V4 的時候第一次購買)不會因行為變化而感到困惑,即使這些變化幾乎發生在二十年前。
via: https://leancrew.com/all-this/2019/02/regex-groups-and-numerals/
作者:Dr.Drang 選題:lujun9972 譯者:geekpi 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive