用power automate爬取政策信息
老师,你好。我想用PAD抓取中国证监会某个时间段的政策制度,但分别打开每条信息的网页,并打开相关pdf链接,并解析pdf文件,将其pdf文件的文本、表格和图片提取到word中,请问怎么操作,试了几次,操作不通。我的思路是:
步骤1:打开网址:http://www.csrc.gov.cn/csrc/c105948/zfxxgk_zdgk.shtml?channelid=a646cc4ea60542d081bd38eab9494c92
步骤2:分别打开每条政策信息;
步骤3:打开每个网页中的链接或pdf链接;(并不一定需要将pdf文件分别下载)
步骤4:解析每个pdf文件,将其pdf文件的文本、表格和图片提取到word中。
步骤5:保存word文件。
0 个回答
暂无回答