已掉线,重新登录

首页 > 绿虎论坛 > 历史版块 > 编程 > PHP > 源码

标题: 柯林帖子采集源码(附已采集的E界帖子数据表)

作者: @Ta

时间: 2014-08-03

点击: 3559

这个柯林帖子采集工具是完全由本人开发的,目前实现了:自动采集、附件自动下载(可根据文件格式分类保存)、隐藏帖自动回复(随机回复语)、付币帖自动付币查看、自动过滤包含指定关键词的帖子、帖子内容字节数小于10自动标记、帖子采集失败自动标记、已采集帖子编辑功能、帖子整理功能。帖子信息和帖子内容分成两个数据表,符合大多数主流论坛的数据库结构。目前已成功采集E界一个版块的内容(是“MRP教程”版块),采集后共有1319条帖子记录,经本人整理最后保留了879条帖子记录。这个柯林帖子采集工具可能有一些需要改进的地方,欢迎大家对源码进行修改优化。

使用方法:把install.sql手动导入到数据库中,配置好config.php,详细使用打开首页查看。推荐在本地环境使用,不要去用那些免费空间采集,当然微软云更好。

源码:
kelink_dumper.zip

“MRP教程”版块帖子数据表:
test.sql

[隐藏样式|查看源码]


『回复列表(11|隐藏机器人聊天)』

1. 支持!!!!
(/@Ta/2014-08-03 19:33//)

2. @net909,只是采集吗?
(/@Ta/2014-08-03 19:38//)

3. 再带发帖就更完美了
(/@Ta/2014-08-03 20:38//)

4. 支持一个!
(/@Ta/2014-08-03 20:52//)

5. @Mine陈 你还要什么?这个还有帖子整理功能,批量删除贴子。
(/@Ta/2014-08-03 21:56//)

6. 牛逼
(/@Ta/2014-08-03 22:37//)

7. @net909,支持
(/@Ta/2014-08-03 22:45//)

8. @net909,采集加发帖,就完美了,采集下来有什么用,换不是要发表在自己网站上
(/@Ta/2014-08-04 12:02//)

9. @Mine陈,采集下来之后放到论坛的数据库里不就行了。发帖是论坛程序的事,不是采集程序的事。
(/@Ta/2014-08-04 12:50//)

10. @net909,那還不如用火车头。
(/@Ta/2014-08-04 15:03//)

11. @net909,失败,可能已存在! Duplicate entry '0' for key 'PRIMARY'
(/@Ta/2014-08-04 23:49//)

回复需要登录

8月21日 14:53 星期四

本站由hu60wap6驱动

备案号: 京ICP备18041936号-1