通过本功能可将任何HTML网页转为格式化API输出,方便给自己的App/微信公众号/小程序等作为数据接口调用。匹配规则为DIV结构的CLASS或ID,系统自动匹配标签内的内容。
以凤凰网新闻列表页面为例():
Ctrl+U或右键查看网页源代码,找到如下DIV结构:
在首页找到“网页转API”功能链接,点击进入之后在对应的输入框填写接口名称、简介、网页采集地址和匹配规则:
链接匹配规则:.juti_list h3 a概要匹配规则:.juti_list .clearfix p封面匹配规则:.juti_list .clearfix .ju_pic img时间匹配规则:.juti_list .clearfix .ping03 span
(注意:没有填写匹配规则是无法采集数据的,也就无法转API输出)
输入完成后点击底部按钮测试运行,正常情况下小程序链接如何转成网页链接,系统会实时获取并转化该网页列表为JSON数据如下图所示。如有获取的数据由有问题,可以点击右上角的转换列表继续修改。
完成后,在控制台-个人中心-我的网页转API,可以看到你添加的网页转API的数据采集信息,自动采集功能有三种状态小程序链接如何转成网页链接,分别如下图所示:
红色为用户停止了采集,绿色为正在采集,黑色为正在审核或未审核通过。
请注意:该接口需要审核通过才可以调用,与天行数据图文类接口返回结构和调用方式一致。在右上角的调用API或控制台-个人中心-我的网页转API,可以查看每个地址对应的API接口。
API接口中的key为必填参数,参数值为个人中心的apikey。urlid为必填参数,参数值为你在转换列表中对应的ID,num为可填参数,默认为10。另外,该接口的增加了一个可选的docid参数,当docid参数设为对应的链接ID时营销引流,则返回该对应链接下的完整文本内容。其他参数与天行数据图文类接口一致,具体请查看相关接口文档。
如果你需要抓取的数据生成API后只有自己可以调用,则可以申请成为私有API。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。