創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!
小編給大家分享一下python讀txt亂碼怎么辦,相信大部分人都還不怎么了解,因此分享這邊文章給大家學習,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學習方法吧!
從報錯講起:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence
出現(xiàn)這個錯誤一般是由于打開文件時,沒有指定編碼引起的,比如下面代碼
with open('../corpus.txt', mode = 'r') as f:
解決方法很簡單,為其指定編碼就行了
with open('../corpus.txt', encoding='utf-8', mode = 'r') as f:
還有一個常見的問題就是,生成txt文件,查看內(nèi)容時發(fā)現(xiàn)亂碼,這可能與你在打開文件時沒有指定編碼方式有關
代碼就像這樣
output = open('context.txt', 'w')
解決的方式也很簡單,只要在打開文件時,指定文件編碼就行了
output = open('context.txt', 'w', encoding="utf-8")
以上是python讀txt亂碼怎么辦的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)-成都網(wǎng)站建設公司行業(yè)資訊頻道!