点开工具、字典、anything


大致思路

<h4>技术选型</h4> <p>go + (插件待定)</p> <p><br></p> <h4>基本思路</h4> <ul> <li> <ol> <li>统一爬虫入口,每次执行时候动态指定执行的爬虫 和 爬下来的文件存放(json)</li> </ol> </li> <li> <ol> <li>统一上传 + 入库入口,将爬下来的图片 or 视频上传到阿里云,并请求点开后台接口入库</li> </ol> </li> <li> <ol> <li>其他一些通用的视频转换,格式转换工具的封装</li> </ol> </li> </ul> <p><br></p> <h4>爬虫步骤</h4> <p>确定游标 首页 =&gt; 第 n 页的请求构造,解析 进入到列表的详情页 =&gt; 进行内容爬取</p> <p><br></p> <h4>申请凭证</h4> <p><a href="https://www.showdoc.cc/344608763388140?page_id=2201529503595178">https://www.showdoc.cc/344608763388140?page_id=2201529503595178</a></p> <p><br></p> <h4>参数提交</h4> <p><a href="https://www.showdoc.cc/344608763388140?page_id=2379117720112528">https://www.showdoc.cc/344608763388140?page_id=2379117720112528</a></p>

页面列表

ITEM_HTML