這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)如何進(jìn)行PyQuery理論分析,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
成都創(chuàng)新互聯(lián)主要從事網(wǎng)站建設(shè)、成都網(wǎng)站制作、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)宜君,10余年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來(lái)電咨詢建站服務(wù):18980820575
hello,各位小伙伴,大家好,上次我們是了解到了html的基礎(chǔ)知識(shí),那有人就有疑問(wèn)了,我是查看到了html上的信息了,我想獲取了,但是如何才能把其上面的我想要的信息給拿下來(lái)呢?有什么工具嗎?嗯,說(shuō)明這位同學(xué)還是很愛(ài)思考的,目前我們市面上可以獲取html的相關(guān)工具是非常多的,目前工業(yè)界用的比較多的是:BeautifulSoup、xpath、 pyquery。今天我們介紹的是pyquery 這個(gè)也是我在工作中用的最多的一款工具,可以說(shuō)是非常的得心應(yīng)手。好,接下來(lái)我們就來(lái)了解一下這個(gè)工具。
pyquery庫(kù)是jQuery的Python實(shí)現(xiàn),可以用于解析HTML網(wǎng)頁(yè)內(nèi)容,官方文檔地址是:http://packages.python.org/pyquery/
pyquery 可讓你用 jQuery 的語(yǔ)法來(lái)對(duì) xml 進(jìn)行操作。這I和 jQuery 十分類似。如果利用 lxml,pyquery 對(duì) xml 和 html 的處理將更快。
這個(gè)庫(kù)不是(至少還不是)一個(gè)可以和 JavaScript交互的代碼庫(kù),它只是非常像 jQuery API 而已。
pip install pyquery
或下載安裝:https://pypi.python.org/pypi/pyquery/#downloads
引入庫(kù):from pyquery import PyQuery as pq
1、直接字符串
doc=pq("") pq 參數(shù)可以直接傳入 HTML 代碼,doc 現(xiàn)在就相當(dāng)于 jQuery 里面的 $ 符號(hào)了
2、lxml.etree
doc=pq(etree.fromstring(""))
可以首先用 lxml 的 etree 處理一下代碼,這樣如果你的 HTML 代碼出現(xiàn)一些不完整或者疏漏,都會(huì)自動(dòng)轉(zhuǎn)化為完整清晰結(jié)構(gòu)的 HTML代碼。
3、直接傳URL
doc=pq('http://www.baidu.com')
這里就像直接請(qǐng)求了一個(gè)網(wǎng)頁(yè)一樣,類似用 urllib2 來(lái)直接請(qǐng)求這個(gè)鏈接,得到 HTML 代碼
4、傳文件
doc=pq(filename='hello.html')
可以直接傳某個(gè)路徑的文件名。
上述就是小編為大家分享的如何進(jìn)行PyQuery理論分析了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。