get没有stream=True，所以在get的时候已经开始下载了 #2

YouJiacheng · 2021-08-05T15:07:50Z

try:
    res = auth_get(url, session, username, password, timeout=15)
except requests.exceptions.Timeout:
    print('请求超时:', filename)
    return
print('开始下载：' + filename)

auth_get里面调用get的时候是没有stream=True的
另外，下载用异步应该就行了，没必要多进程吧

dylanyang17 · 2021-09-20T10:25:01Z

你好，首先这个“没有stream=True”是指有什么问题呢？
第二个问题的话，确实用协程更合适一点，毕竟爬虫是IO密集型任务。刚开始写的时候是我疏忽了，后来觉得效率还能接受就没有改了，之后会考虑换成协程的。
最后非常感谢你的建议，有其它问题或者建议的话也欢迎提出。

YouJiacheng · 2021-09-20T14:34:45Z

你好，首先这个“没有stream=True”是指有什么问题呢？
第二个问题的话，确实用协程更合适一点，毕竟爬虫是IO密集型任务。刚开始写的时候是我疏忽了，后来觉得效率还能接受就没有改了，之后会考虑换成协程的。
最后非常感谢你的建议，有其它问题或者建议的话也欢迎提出。

requests的get有个参数stream，默认是False，这样就会在get的时候阻塞直到整个response下载完毕，所以代码中print开始下载的时候，已经下载到内存中了。

dylanyang17 · 2021-09-20T15:51:36Z

明白了，这里的显示确实有问题，下一个版本（如果有的话）我打算把 print 开始下载移到 try 上面，这个解决方案可能更合适一点。用 stream 下小图片的话感觉还是没必要了，而且假设是要分块写入文件的话，网络断开还会导致图片文件不完整。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

get没有stream=True，所以在get的时候已经开始下载了 #2

get没有stream=True，所以在get的时候已经开始下载了 #2

YouJiacheng commented Aug 5, 2021

dylanyang17 commented Sep 20, 2021

YouJiacheng commented Sep 20, 2021 •

edited

Loading

dylanyang17 commented Sep 20, 2021

get没有stream=True，所以在get的时候已经开始下载了 #2

get没有stream=True，所以在get的时候已经开始下载了 #2

Comments

YouJiacheng commented Aug 5, 2021

dylanyang17 commented Sep 20, 2021

YouJiacheng commented Sep 20, 2021 • edited Loading

dylanyang17 commented Sep 20, 2021

YouJiacheng commented Sep 20, 2021 •

edited

Loading