diff --git a/README.md b/README.md index 7da707f..16763e5 100644 --- a/README.md +++ b/README.md @@ -238,7 +238,7 @@ $ python3 -m weibo_spider --u="1669879400,1223178222" ## 常见问题 -如果运行程序的过程中出现错误,可以查看[常见问题](https://github.com/dataabc/weiboSpider/blob/master/docs/FAQ.md)页面,里面包含了最常见的问题及解决方法。如果出现的错误不在常见问题里,您可以通过[发issue](https://github.com/dataabc/weiboSpider/issues/new/choose)寻求帮助,我们会很乐意为您解答。 +如果运行程序的过程中出现错误,可以查看[常见问题](https://github.com/dataabc/weiboSpider/blob/master/docs/FAQ.md)页面,里面包含了最常见的问题及解决方法。另一方面,由于当前项目所使用的技术或API的局限性,我们已知某些情况无法处理或某些需求无法实现,已将其整理总结在了[已知问题](https://github.com/dataabc/weiboSpider/blob/master/docs/known_issues.md)。除此之外,如果您在程序使用过程中遇到与预期不符的行为,可以通过[发issue](https://github.com/dataabc/weiboSpider/issues/new/choose)寻求帮助,我们会很乐意为您解答。 ## 学术研究 diff --git a/docs/known_issues.md b/docs/known_issues.md new file mode 100644 index 0000000..fff994a --- /dev/null +++ b/docs/known_issues.md @@ -0,0 +1,23 @@ +# 已知问题 + +该文档列出由于本项目所选用的技术局限而导致的已知的无法或难以在短时间内修复的问题。 + +## 1. 程序无法爬取同时带有图片和视频的微博 + +参见:https://github.com/dataabc/weiboSpider/issues/668 + +具体原因如下: + +当前项目的爬取实现是通过微博移动版来实现的(weibo.cn 而非 weibo.com),因为移动版的结构相对简单。 + +对于同时带有图片和视频的微博,在移动版的显示如下:https://weibo.cn/3384824824/Q11YMrQtB + +``` +#PS5##合金装备# [查看全部图片/视频] 08月22日 15:07 关注他 +``` + +其中 `[查看全部图片/视频]` 只有一个链接到微博桌面版,而没有可供可直接爬取的数据: + +``` +查看全部图片/视频 +```