该采集系统有如下特点:
主流语言 - 采用php+mysql编写而成,安装对应服务器即可。
完全开源 - 开源代码,且代码均有中文注释,方便管理与学习交流。
规则自定义 - 可以自定义采集规则,可以采集大部分网站内容。
数据修改 - 自定义修改规则,优化数据内容。
数据保存 - 数组形态,系列化数据保存至文件或数据库,方便上传、调用。
图片读取 - 可以读取内容的图片,并保持至本地。
编码控制 - 转换编码,可以保存gb2312,gbk等编码至utf-8。
标签清理 - 可以自定义保留的标签,清理掉不必要标签。
安全性能 - 通过密码控制读取,远程读取亦安全。
操作简单 - 一键读取操作,可以按规则分组读取,或指定规则id读取,单一id读取。
规则分组 - 按规则分组读取数据,及时更新采集数据。
自定义读取 - 按自定义规则id读取数据,有效更及时。
JS读取 - 运用js控制读取时效,降低服务器负载。
超时控制 - 可设定页面执行时间, 减少timeout错误。
多次读取 - 可设定对网页多次读取控制,可以更有效的读取数据。
错误控制 - 如果多次出错,可以停止读取,减小服务器资源占用。
负载控制 - 多文件夹保存数据,可以有效的解决多文件下服务器负载。
数据修改 - 不仅可以浏览数据,而且可以对主体数据进行修改。
规则分析 - 可以向其他人分享您的规则,让更多人使用。
规则下载 - 下载分享规则,快速获取需要的内容。
有用
有用
有用