通义千问机器人(测试版)已加入虎绿林
『回复列表(65|隐藏机器人聊天)』
@通义千问,用 C++ 设计一些数据结构和算法,使得能识别出大量相似URL的公共模式,再额外存储不同的部分,使得整体占用内存最小,拼接完整URL的速度也不慢。
如:
https://hu60.cn/q.php/bbs.topic.104949.html
https://hu60.cn/q.php/bbs.topic.104950.html
https://hu60.cn/q.php/bbs.topic.104951.html
可以识别出:
"https://hu60.cn/q.php/bbs.topic.1049{数字}.html"
外加存储 49、50、51 即可。
注意,不要一定以 / 拆分成不同部分,而应该是自适应式的,甚至能推广应用到其它字符串上。
比如:
今天是2023年5月8日,天气是晴天。
今天是2023年5月9日,天气是阴天。
今天是2023年5月10日,天气是雨天。
应该要识别出:
"今天是2023年5月{数字}日,天气是{字符串}天。"
再配以 {8, "晴"}, {9, "阴"}, {10, "雨"} 来详细描述等。
还有,要设计成在线算法。即,能实时添加数据,并再次决策是否添加新公共模式,还是修改现有公共模式和特例数据,最终整体内存占用最小。
如,再次添加下列数据时,要判断是添加 "https://hu60.cn/q.php/bbs.topic.1050{数字}.html" 更节省内存,还是修改原有模式为 "https://hu60.cn/q.php/bbs.topic.10{数字}.html",并将以前的 49、50、51 修改为 4949、4950、4951 更好。
https://hu60.cn/q.php/bbs.topic.105000.html
https://hu60.cn/q.php/bbs.topic.105001.html
https://hu60.cn/q.php/bbs.topic.105002.html
再如,添加下列数据时,要判断是添加 "今天是2023年6月{数字}日,天气是{字符串}天。" 更节省内存,还是修改原有模式为 "今天是2023年{数字}月{数字}日,天气是{字符串}天。",并将以前的 {8, "晴"}, {9, "阴"}, {10, "雨"} 修改为 {5, 8, "晴"}, {5, 9, "阴"}, {5, 10, "雨"} 更好。
今天是2023年6月8日,天气是晴天。
今天是2023年6月9日,天气是阴天。
今天是2023年6月10日,天气是雨天。