已掉线,重新登录

首页 > 绿虎论坛 > 杂类 > 超级灌水 (发帖)

标题: [精]2011年虎绿林开站以来沙雕网友究竟发了多少帖子?

作者: @Ta

时间: 2019-07-06发布,2019-07-06修改

点击: 18336

9fc6a7f47c9380fa4efbd455d1e843f255575.png
2011年8月火爆无比,虎林达到历史性的顶峰,当月豪揽一千七百多帖。然而继然滑铁卢一坠千里,同年11月降到冰点,继而稳步回升。
2013年8月再次达到历史性的第二顶峰!波澜壮阔,连绵起伏两年后。
2015年8月达到当年顶峰,然后在其之后,一蹶不振,热度稳步下滑至今。
每月大致数据基本如下:
时间	发帖量
2011年1月	19
2011年2月	193
2011年3月	45
2011年4月	0
2011年5月	702
2011年6月	1108
2011年7月	1532
2011年8月	1755
2011年9月	843
2011年10月	651
2011年11月	269
2011年12月	404
2012年1月	474
2012年2月	605
2012年3月	425
2012年4月	761
2012年5月	715
2012年6月	852
2012年7月	1078
2012年8月	1005
2012年9月	471
2012年10月	693
2012年11月	663
2012年12月	1062
2013年1月	1143
2013年2月	1245
2013年3月	961
2013年4月	1023
2013年5月	924
2013年6月	1063
2013年7月	1256
2013年8月	1518
2013年9月	759
2013年10月	872
2013年11月	808
2013年12月	912
2014年1月	890
2014年2月	767
2014年3月	617
2014年4月	608
2014年5月	677
2014年6月	714
2014年7月	1215
2014年8月	1060
2014年9月	657
2014年10月	663
2014年11月	616
2014年12月	633
2015年1月	615
2015年2月	754
2015年3月	623
2015年4月	570
2015年5月	564
2015年6月	616
2015年7月	882
2015年8月	997
2015年9月	612
2015年10月	414
2015年11月	410
2015年12月	454
2016年1月	365
2016年2月	294
2016年3月	265
2016年4月	307
2016年5月	283
2016年6月	300
2016年7月	411
2016年8月	363
2016年9月	278
2016年10月	346
2016年11月	258
2016年12月	319
2017年1月	326
2017年2月	374
2017年3月	291
2017年4月	231
2017年5月	264
2017年6月	246
2017年7月	265
2017年8月	268
2017年9月	239
2017年10月	220
2017年11月	248
2017年12月	190
2018年1月	186
2018年2月	156
2018年3月	198
2018年4月	214
2018年5月	240
2018年6月	223
2018年7月	196
2018年8月	192
2018年9月	152
2018年10月	138
2018年11月	118
2018年12月	167
2019年1月	134
2019年2月	101
2019年3月	129
2019年4月	156
2019年5月	165
2019年6月	167
2019年7月	39


贴代码,Java,使用mybatis plus的代码生成器一键生成实体类等,因此就不贴实体类跟Mapper,Service层代码了。
下面是测试代码:
    @Autowired
    private LaohuMapper laohuMapper;
    @org.junit.Test
    /**
     * 将网页信息存到数据库 最笨的方式
     */
    public void huTest() {
//        遍历页码 使用虎林自带的json格式
        for (int i = 1; i <= 2775; i++) {
//            Http这个是nutz jar包里封装好的工具
            Response response = Http.get("https://hu60.cn/q.php/bbs.forum.0." + i + ".json");
//            解说json化 并且取出各种信息
            JSONObject result = (JSONObject) JSONObject.parse(response.getContent());
            JSONArray topicList = (JSONArray) result.get("topicList");
            for (Object o : topicList) {
                JSONObject jo = (JSONObject) o;
//                这个操作去除字符串中的emoji表情 MySQL默认编码不支持emoji 1.改编码 2.直接去掉 这里采用后者
                String title = jo.get("title").toString().replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", "");
                System.out.println(title);
                String view = jo.get("read_count").toString();
                String count = jo.get("reply_count").toString();
                String uinfo = jo.get("uinfo").toString();
                JSONObject parse = (JSONObject) JSONObject.parse(uinfo);
//                topic_id也是帖子链接URL的关键一部分下面备用
                String topicId = jo.get("topic_id").toString();
                String locked = jo.get("locked").toString();
                String name = null;
                try {
                    Laohu laohu = new Laohu();
                    if ("0".equals(locked.trim())) {
                        JSONObject content = (JSONObject) JSONObject.parse(Http.get("https://hu60.cn/q.php/bbs.topic." + topicId + ".json").getContent());
                        JSONObject tContents = (JSONObject) content.getJSONArray("tContents").get(0);
                        String context = tContents.get("content").toString().replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", "");
                        laohu.setContent(context);
                    }
                    name = parse.get("name") == null ? "" : parse.get("name").toString();
                    Long time = Long.valueOf(jo.get("ctime").toString()) * 1000;
//                 实体类中开启了Lombok注解 @Accessors(chain = true) 链式set
                    laohu.setTitle(title)
                            .setVisit(view)
                            .setTime(new Date(time))
                            .setCount(Integer.valueOf(count))
                            .setAuthor(name);
//                    插入记录 mybatis plus自带方法
                    laohuMapper.insert(laohu);
                } catch (Exception e) {
                    e.printStackTrace();
                    continue;
                }
            }
        }
    }

提取数据完毕 就能利用SQL对数据进行统计筛选操作了……

[隐藏样式|查看源码]


『回复列表(24|隐藏机器人聊天)』

1.
时间在变,人来来去去,都慢慢学会了沉默 hmd global nokia 7 plus(黑色)
(/@Ta/2019-07-06 18:51//)

2. 当年4月发生了什么人气直接暴涨?8月份又发生了什么人气暴跌?任何突然变化绝对不是偶然吧?难道有其他热站导流,还是当时打了广告?是道德的沦丧,还是人性的堕落?欢迎锁定本贴,每晚8点准时相约,让我们,,跑题了额,这是为什么老虎
(/@Ta/2019-07-06 19:12//)

3.

这么多年一共发了4贴
斗图专属版

(/@Ta/2019-07-06 19:22//)

4.
好难受 虎友高配版(绿色)
(/@Ta/2019-07-06 19:34//)

5.

说回来,14年后智能机全面过渡普及,WAP站点集体式微,hu60也只是潮流中的一员了。我正好是2011年才知道PHP的存在~
斗图专属版

(/@Ta/2019-07-06 19:48//)

7.

@o,我不信,

(/@Ta/2019-07-06 21:40//)

9.

爬虫嘛
啦啦啦啦

(/@Ta/2019-07-06 21:53//)

10. @简单,不知道算不算,遍历页面把帖子都保存到数据库了,待会贴代码。
(/@Ta/2019-07-06 22:07//)

11. 多数都是学生啊,一到寒暑假帖子就多了
(/@Ta/2019-07-06 22:09//)

12.

都是大佬
小尾巴我就菜鸡一枚 https://76wp.cn奇乐网

(/@Ta/2019-07-07 01:01//)

13. 8月时,一大波禁止免流来袭,还是挂机党被禁止
(/@Ta/2019-07-07 09:25//)

14. @姜辰,我看了下,我13年注册的,当时因为“免流”或者“挂Q”知晓的,具体忘了。

据我估计,13年前后,(特别是13年前)免流流行。

然后就是当时挂Q流行,(chen挂Q,和另外一个什么???)

这也致使我走上编程(PHP)的不归路,导致如今大学。。。。。。。。。

如果当时没走进hu60,那我现在应该就没这么纠结了!!
(/@Ta/2019-07-07 14:27//)

15.

@无道由此可见,不要随意学东西
hmd global nokia 7 plus(黑色)

(/@Ta/2019-07-07 14:38//)

16.
用户被禁言,发言自动屏蔽。
(/@Ta/2019-07-07 14:52//
被禁言
)

17. @姜辰,但是话说回来,最起码这是我喜欢的。

如若不然,大学也不知道学什么。

凡事有得必有失嘛,人永远不知道未来是什么,也不知道当下的决定会对以后有什么影响,只能尽量按照现有的知识、想法、尽量走好每一步。
(/@Ta/2019-07-07 15:07//)

18.

@无道
hmd global nokia 7 plus(黑色)

(/@Ta/2019-07-07 15:16//)

19.
用户被禁言,发言自动屏蔽。
(/@Ta/2019-07-07 23:23//
被禁言
)

20.


来自 Redmi Note5

(/@Ta/2019-07-08 02:16//)

21. 我是12年来的 一直潜水 当初就是因为免流好像 账号换了几个了
(/@Ta/2019-07-08 12:13//)

下一页 1/2页,共24楼

回复需要登录

6月30日 02:49 星期一

本站由hu60wap6驱动

备案号: 京ICP备18041936号-1