复制代码 代码如下:
# -*- coding:utf-8 -*-
import httplib
import urllib
import string
import re
def getContent(): #从网站中获取所有内容
conn = httplib.HTTPConnection("tu.duowan.com")
conn.request("GET", "/m/meinv/index.html")
r = conn.getresponse()
print r.status, r.reason
data1 = r.read()#.decode('utf-8') #编码根据实际情况酌情处理
return data1
def getImageUrl(data): #将获取到img链接写到sour.txt文件中国
sour = open("test\\sour.txt", 'w')
pplen = len("http://s1.dwstatic.com/group1/M00/37/2A/e2c30e89184ea942a4be9c1f7ba217a5.jpg")
for i in range(len(data) - 3):
if data[i] == 'i' and data[i + 1] == 'm' and data[i + 2] == 'g':
for j in xrange(i + 9, i + 9 + pplen):
sour.write(data[j])
sour.write('\n')
sour.close()
def downImage(): #根据test\\sour.txt里面的url自动下载图片
tt = 0 #name
sour = open('test\\sour.txt')
while 1:
line = sour.readline()
if line:
Len = len(line)
#print Len
if line[Len - 2] == 'g' and line[Len - 3] == 'p' and line[Len - 4] == 'j':
path = line
data = urllib.urlopen(line).read()
f = open('test\\' + str(tt) + '.jpg', 'wb')
f.write(data)
f.close()
tt = tt + 1
else:
break
sour.close()
content = getContent()
getImageUrl(content)
downImage()
图片下载
更新日志
- 孙悦.1996-伙伴【正大国际】【WAV+CUE】
- 纪钧瀚《钢琴阅读时光 雨中书店聆听轻音乐》[FLAC/分轨][399.62MB]
- 证声音乐图书馆《走向自然 疗心爵士乐》[320K/MP3][87.4MB]
- 证声音乐图书馆《走向自然 疗心爵士乐》[FLAC/分轨][184.94MB]
- 陈慧娴.2018-Priscilla-Ism演唱会3CD(2024环球红馆40复刻系列)【环球】【WAV+CUE】
- 郑秀文.1999-我应该得到(国)【华纳】【WAV+CUE】
- 陈家慧.2011-钢琴酒吧2CD【龙吟唱片】【WAV+CUE】
- 证声音乐图书馆《雨季 蓝调吉他 Rainy Blues》[320K/MP3][45.01MB]
- 证声音乐图书馆《雨季 蓝调吉他 Rainy Blues》[FLAC/分轨][109.13MB]
- 赞多《序章》[320K/MP3][45.54MB]
- 许巍.2004-每一刻都是崭新的【步升大风】【WAV+CUE】
- 群星.2024-四方馆影视原声带【韶愔音乐】【FLAC分轨】
- 陈雷.1997-安锁咧【金圆唱片】【WAV+CUE】
- 关淑怡.2013-MY.FAVORITE.SK.3CD【环球】【WAV+CUE】
- Sweety.2006-花言乔语【丰华】【WAV+CUE】