pyList

python 通过正则获取网页里所有超级链接

python 通过正则获取网页里所有超级链接

import re, urllib
htmlSource = urllib.urlopen("http://www.python.org").read(200000)
linksList = re.findall('<a href=(.*?)>.*?</a>',htmlSource)
for link in linksList:
    print link

本文网址: https://pylist.com/t/1441289297 (转载注明出处)
如果你有任何建议或疑问可以在下面 留言
Be the first to comment!
Captcha image
Relative Articles