已掉线,重新登录

首页 > 绿虎论坛 > 历史版块 > 编程 > PHP > 源码

标题: [源码.更新1]虎绿林帖子收集源码

作者: @Ta

时间: 2014-09-26

点击: 5744

以下为更新版:(可直接在线访问 而不用查看hu.txt)
 hu.zip
这是源码以及我已经采集的帖子 

注:此采集非彼采集,该源码只是收集首页帖子的名字(因为我周末在线,不想错过某些'资源贴,而又懒得一页一页翻) 
 <?php

header("content-Type: text/html; charset=utf-8");
 
$do=$_GET['do'];
#print_r($r);
$txt=@file_get_contents('hu.txt'); 
echo "<a href=?do=send>采集</a>|<a href=?do=look>查看</a><hr>";
if($do=='send'){
for($i=0;$i<8;$i++){
echo $f=file_get_contents('http://hu60.cn/wap/');
preg_match_all('!tzid=(\d+)&amp;bkid=(\d+)">(.*?)</a>!i',$f,$r); 
$bkid=$r[2][$i];
$tzid=$r[1][$i];
$name=$r[3][$i];
if(strpos($txt,$name)===false){
$url="http://allnew.hu60.cn/wap/read.php?id=bbs_tz&tzid={$tzid}&bkid={$bkid}";
file_put_contents('hu.txt',$name."|$url"."\n",FILE_APPEND);}

}}
if($do=='look'){
$m=explode("\n",$txt);
foreach($m as $t){
$ui=explode('|',$t);
$name=$ui[0];
$url=$ui[1];
echo "<a href=$url>$name</a>
";
}

}

?>
以下为旧版:
<?php
echo $f=file_get_contents('http://hu60.cn/wap/');
preg_match_all('!bkid=(\d+)">(.*?)</a>!i',$f,$r);
#print_r($r);
foreach($r[2] as $o){
$txt=@file_get_contents('hu.txt');
if(strpos($txt,$o)===false){

file_put_contents('hu.txt',"$o"."\n",FILE_APPEND);}

}

注:此采集非彼采集,该源码只是收集首页帖子的名字(因为我周末在线,不想错过某些'资源贴,而又懒得一页一页翻)

[隐藏样式|查看源码]


『回复列表(12|隐藏机器人聊天)』

1. 顶
(/@Ta/2014-09-08 06:49//)

2. 哎呦~~
(/@Ta/2014-09-08 09:05//)

3. 大神,怎么出来了hu.text
(/@Ta/2014-09-21 18:24//)

4. @bai120501,记录帖子
(/@Ta/2014-09-26 18:39//)

5. @无道,打包呗……
(/@Ta/2014-09-26 18:57//)

6. hu.zip
@穴儿,,这是源码以及我已经采集的帖子
(/@Ta/2014-09-26 19:19//)

7. 谢谢分享
(/@Ta/2014-09-26 23:29//)

8. @无道,你怎么不开发个php举牌小偷程序,顺便开源呀!
(/@Ta/2014-09-27 23:58//)

9. @无道,可以直接采集多页的保存下来导入数据库
(/@Ta/2014-09-28 00:13//)

10. 是监控hu.php?do=send吗
(/@Ta/2014-09-30 09:27//)

11. @xxxxxx,不明白意思,
(/@Ta/2014-09-30 16:54//)

12. 注:此采集非彼采集,该源码只是收集首页帖子的名字(因为我周末在线,不想错过某些'资源贴,而又懒得一页一页翻)
(/@Ta/2014-09-30 17:42//)

回复需要登录

8月10日 00:28 星期天

本站由hu60wap6驱动

备案号: 京ICP备18041936号-1