python淺談?wù)齽t的常用方法覆蓋范圍70%以上
上一次很多朋友寫文字屏蔽說到要用正則表達,其實不是我不想用(我正則用得不是很多,看過我之前爬蟲的都知道,我直接用BeautifulSoup的網(wǎng)頁標(biāo)簽去找內(nèi)容,因為容易理解也方便,),而是正則用好用精通的很難(看過正則表的應(yīng)該都知道,里面符號對應(yīng)的方法規(guī)則有很多,很靈活),對于接觸編程不久的朋友們來說很可能在編程的過程上浪費很多時間,今天我把經(jīng)常會用到正則簡單介紹下,如果不是很特殊基本都覆蓋使用。
1.正則的簡單介紹
首先你得導(dǎo)入正則方法 import re 正則表達式是用于處理字符串的強大工具,擁有自己獨立的處理機制,效率上可能不如str自帶的方法,但功能十分靈活給力。它的運行過程是先定一個匹配規(guī)則("你想要的內(nèi)容+正則語法規(guī)則"),放入要匹配的字符串,通過正則內(nèi)部的機制就能檢索你想要的信息。
2.findall的常用幾種姿勢
基本結(jié)構(gòu)大致: nojoke = re.findall(r'匹配的規(guī)則','要檢索的愿字符串') nojoke就是我們最后通過正則返回的結(jié)果,re正則findall查找全部r標(biāo)識代表后面是正則的語句(這樣在代碼多的時候好查閱),下面我們看看幾個例子好深入了解
這段代碼是找出檢索字符串中所有的bi并以列表的形式返回,這個會經(jīng)常用到計算統(tǒng)一字符出現(xiàn)的次數(shù)。繼續(xù)看下一個
這里加了個符號^表示匹配以abi開頭的的字符串返回,也可以判斷字符串是否以abi開始的。