【Python】Parse網頁最好用的語言 - Python - lxml | kendoit | 數位生活分享 | 痞客邦

基本流程是先抓取網頁 (urllib, urllib2 or Twisted)

配合FireFox的工具

如果有一些工具可以幫助寫解析網頁的程式該有多好，這也是我希望能有的，使用了xpath之後，我找到了FireFox的插件，XPath checker等xpath的工具，可以先用它來確定抓到的元素是正確的，然後FireBug在檢視網頁結構上也有很大的幫助

kendoit

kendoit 發表在痞客邦留言(0) 人氣( 23 )

▲top

請先登入以發表留言。