如下所示:
import re # 過濾不了\\ \ 中文()還有———— r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用戶也可以在此進(jìn)行自定義過濾字符 # 者中規(guī)則也過濾不完全 r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+" # \\\可以過濾掉反向單杠和雙杠,/可以過濾掉正向單杠和雙杠,第一個(gè)中括號(hào)里放的是英文符號(hào),第二個(gè)中括號(hào)里放的是中文符號(hào),第二個(gè)中括號(hào)前不能少|(zhì),否則過濾不完全 r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+" # 去掉括號(hào)和括號(hào)內(nèi)的所有內(nèi)容 r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]" text = "\崔蕓,\\我愛=+你!【我//""們】~————結(jié)/婚'吧::!這.!!_#??()個(gè)‘'“”¥$主|意()不錯(cuò)......!" print(re.sub(r1, , '', text))