[筆記]_正規表達式

正規表達式 (Regulay Expression)

Regular Expression 是一套規則模式(pattern)，
可以用來做文字的搜尋、比對、萃取、替代、轉換等等，在許多的程式語言中都支援，
簡稱 Regex, Regexp 或 RE。

Regular Expression 是在 UNIX 世界中發展出來的字串比對技巧，
基本概念是用一套簡單 (但功能強大) 的符號來比對字串，
並可對符合比對條件的字串進行修改或其他運算。
Regex 可以實用的情境大致有幾種：
1. 尋找匹配的字串
2. 取代匹配的字串
3. 驗證使用者輸入資料的欄位
4. 擷取某段想要的資訊

	說明
`i`	不區分大小寫。
`m`	使用多行模式，使 `^` 和 `$` 會比對每一行的開頭與結尾，而不是輸入字串的開頭和結尾。
`s`	使用單行模式，使 `句點.` 會比對每個字元，而不是換行符號 `\n` 以外的每個字元。
`g`	使用全域比對模式， g flag 會保留lastIndex的狀態，讓下一次再匹配時，可以從lastIndex的位置開始找起。
`x`	將模式中的空白忽略。
`A`	強制以目標字符串開頭匹配。
`U`	禁止貪婪匹配，只匹配最近的一個字符串。 (不重複匹配)
`gi`	全域比對並忽略大小寫。

方法	說明	語法格式
`exec`	搜尋比對，符合傳回Array；不符合傳回 null。	`regexObj.exec(str)`
`test`	搜尋比對，符合傳回true；不符合傳回false。	`regexObj.test(str)`

方法	說明	語法格式
`match`	搜尋比對，如果符合的狀況正規表達式包含g符號，則傳回所有相符的字串；不包含g則傳回Array，無符合傳回null。	`str.match(regexp)`
`search`	搜尋比對，符合傳回第一個相符的索引 (index)，不符合傳回 -1。	`str.search(regexp)`
`replace`	取代字串，如果符合傳回一個新字串，不影響原字串。	`str.replace(regexp, newstr)`
`split`	分割字串，如果符合傳回分割後的Array，不影響原字串。	`str.split(regexp)`

對於量詞，Regex的匹配預設採取貪婪模式(盡可能多匹配)。
?接在量詞後方，表示盡可能匹配短結果。

const match = /<.+?>/.exec('<em>Hello World</em>');
console.log(match[0]);        // <em>

比對方括號裡面的任一字元，可以用範圍匹配

符號	匹配說明
`[]`	方括號，比對方括號裡面的任一字元，可以用範圍匹配： [A-Z]、[a-z]、[0-9]
`[^]`、`[!]`	^代表「反」，比對方括號裡面`以外`的任一字元

用來引用群組的內容。
使用反斜線加上數字。e.g.: \1 (代表第一個群組)

const regex = /(\d+)a\1b/
regex.test('1a1b') // true
regex.test('1a2b') // false

與群組()一起使用。

符號	匹配說明
`$number`、`${number}`	number 表示匹配的群組 (capturing group)，群組編號從 1 開始 $1。 $ 後面接著的所有數字都會被解讀為屬於 number 群組，可以用 `${number}` 語法，例如用 `${1}`1 就不會被解讀為第 11 個群組，而是第 1 個。
`${name}`	用來引用 Named Capturing Group 的值。
$$	用來跳脫 (escape) $ 的特殊意義，表示 $ 字元。
$&	用來引用整個匹配的字串。
$`	用來引用匹配字串的前面的所有字 (before match)。
$’	用來引用匹配字串的後面的所有字 (after match)。
$+	用來引用匹配的最後一個群組。
$_	用來引用整個輸入的字串。