为什么要做这个东西?
https://h4ck.org.cn/2023/12/14852
昨天折腾了好久,不知道为什么通过代码拉取到的rss数据始终是缺的。今天早上把cdn的缓存策略调整成全部关闭貌似正常了。
昨天一天基本白折腾了,最后都开始看rss的api代码了,但是感觉代码貌似也没问题啊。就很奇怪。最终用python实现了一个客户传抓取工具,可以代替php版本。
相比php版本增加了以下配置参数:
FRESHRSS_HOST = 'http://freshrss.h4ck.org.cn' #不带最后的/ 服务器地址 USERNAME = 'obaby' #用户名 PASSWD = '1234567890' #api密码,注意是api密码 labels = ['集美们'] # 输出的订阅标签list ,如果在freshrss订阅了其他的不需要同步到博客的数据使用这个标签功能进行过滤 WRITE_TO_FILE_COUNT = 60 # 最后写入到json文件的订阅数量 SUB_MAX_ITEMS_COUNT = 2 # 每个订阅站点最多展示的条目,当然是为了给每个集美流出更多的出现机会啦 JSON_FILE_PATH = '/home/wwwroot/h4ck.org.cn/rss.json' #json文件路径配置,请放到网站目录下,需要与php文件保持一致
C:\Users\obaby\PycharmProjects\fresrss\baby_rss_client_private.py **************************************************************************************************** _ _ ____ ___ | |__ __ _| |__ _ _ / __ \ _ __ ___ __ _ _ __ ___ / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __| | (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | | \__ \ \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_| |___/ |___/ \____/ FreshRss Clien Verson: 23.12.24 闺蜜圈:https://dayi.ma Blog: http://oba.by 欢迎帮姐姐推广闺蜜圈啊 **************************************************************************************************** [*] Login to get token. [*] Token = obaby/21*******************************576 [*] ---------------------------------------------------------------------------------------------------- [*] All subscriptions= 26 [*] Selected label subscriptions= 25 [*] Total rss item count= 387 [*] Selected labeled rss item count= 387 [*] Write json to file...... 2023-12-24 12:35:00 中国大陆网游限制的发展史 2023-12-24 12:30:00 省份Boss AI绘图 2023-12-24 01:44:00 【笔记】Python3打印日志 2023-12-24 01:44:00 【英文】Python3打印日志 2023-12-23 23:08:00 使用图标为网页增添小细节 2023-12-23 20:25:00 2023年12月小记 2023-12-23 17:42:00 最近在玩什么? 2023-12-23 16:08:00 第一次玩基金赔了 2023-12-23 15:25:00 给友链页面改为随机排序 2023-12-23 11:43:00 离职失败 2023-12-23 02:06:00 开源实例之Miblo 2023-12-23 00:58:00 开源实例之Ephemeris 2023-12-23 00:00:00 Nginx 的 WAF 规则 LuaJIT 高危险版 2023-12-22 13:00:00 给博客添加一个输出友链RSS的页面 2023-12-21 23:18:00 Git命令汇总 2023-12-21 20:52:00 免费开启手机运营商的骚扰电话拦截功能 2023-12-21 16:50:00 用FreshRSS 实现友圈rss订阅 2023-12-21 15:29:00 Zlibrary镜像网站:免费图书下载的新天地 2023-12-21 10:43:00 工资入股? 2023-12-20 00:00:00 Nginx 的 WAF 规则 LuaJIT 中危险版 2023-12-19 19:45:00 Windows 10 数字权利永久激活 2023-12-19 17:43:00 五分钟成功部署一个属于个人的Google Gemini Chat 2023-12-19 13:54:00 闺女发烧了 2023-12-19 12:07:00 揽星 2023-12-18 10:23:00 中招了咳嗽了快一周 2023-12-13 00:00:00 12.13 2023-12-12 11:12:00 蓝易云SCDN — 强大的高防CDN,为你的网站提供全方位防护! 2023-12-12 04:21:00 Vol.69、嘿,废物,去热爱你所有热爱,就像你当初无所畏惧的模样。 2023-12-12 04:20:00 Sleep – Pornopop 选自《And the Slow Songs About the Dead Calm in Your Arms》专辑 2023-12-10 21:11:00 喉咙会哑掉的重感冒 2023-12-10 11:04:00 WordPress 彻底禁用上传媒体图片自动生成缩略图及多尺寸图片 2023-12-09 05:32:00 回顾与展望:写在ChatGPT上线一周年时 2023-12-09 04:42:00 又是两年 2023-12-08 10:00:00 关于换电池这件事 2023-12-03 21:23:00 长安公园晚秋 2023-11-28 20:31:00 小米平板6Pro 安装 Magisk 2023-11-27 23:45:00 「备份」宝塔 User-Agent 过滤以及 IP 段规则 2023-11-25 12:23:00 讯飞免费星火大模型部署教程 2023-11-23 04:07:00 人人都是GPT开发者:如何在10分钟内用GPTs打造你的AI应用 2023-11-14 20:31:00 City walk in 湾里庙步行街 2023-11-12 21:25:00 爱惠浦主滤芯和pp棉更换方法 2023-11-01 23:29:00 小米 14 Pro 16+1T 开箱 2023-10-26 09:25:00 原神,启动!跳转页说明~ 2023-10-18 14:37:00 使用DNSSEC预防反诈的DNS劫持? 2023-10-12 11:12:00 证件照尺寸怎么选 2023-10-09 20:23:00 2023年国庆游高中母校 2023-09-01 13:50:00 用ode45做控制系统仿真 2023-06-28 12:09:00 黑龙江-伊春森林公园之行 2023-01-03 21:49:00 FGHRSH 2022 年度报告 2022-10-05 20:56:00 解决wordpress使用阿里CDN后评论无法获取访客真实IP [*] Write json to file done [*] Write to file items count= 60 [*] Sub items max count= 2 [*] All finished. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
使用前通过pip install -r requriments.txt 安装依赖库
好啦,最终就是这样的,原php代码网站展示效果:
python代码效果:
ps:
如果通过venv写sh运行定时任务可能会出现下面的错误:
sh内容:
cd source venv/bin/activate python baby_rss_client_private.py
obaby@h4ck:~/freshrss$ sh client.sh client.sh: 2: source: not found client.sh: 3: python: not found
通过sudo dpkg-reconfigure dash 命令修改默认的sh处理器,选择no:
obaby@h4ck:~/freshrss$ sudo dpkg-reconfigure dash [sudo] password for obaby: Removing 'diversion of /bin/sh to /bin/sh.distrib by dash' Adding 'diversion of /bin/sh to /bin/sh.distrib by bash' Removing 'diversion of /usr/share/man/man1/sh.1.gz to /usr/share/man/man1/sh.distrib.1.gz by dash' Adding 'diversion of /usr/share/man/man1/sh.1.gz to /usr/share/man/man1/sh.distrib.1.gz by bash'
好啦,就到这里啦:
**************************************************************************************************** _ _ ____ ___ | |__ __ _| |__ _ _ / __ \ _ __ ___ __ _ _ __ ___ / _ \| '_ \ / _` | '_ \| | | |/ / _` | '_ ` _ \ / _` | '__/ __| | (_) | |_) | (_| | |_) | |_| | | (_| | | | | | | (_| | | \__ \ \___/|_.__/ \__,_|_.__/ \__, |\ \__,_|_| |_| |_|\__,_|_| |___/ |___/ \____/ FreshRss Clien Verson: 23.12.24 闺蜜圈:https://dayi.ma Blog: http://oba.by 欢迎帮姐姐推广闺蜜圈啊 ****************************************************************************************************
代码地址:
https://github.com/obaby/Baby-Freshrss-Client
54 comments
🐂,这个作业炒不来
其实也简单,就是把原来php获取rss数据改成python了。主要是php代码写不惯,各种api和方法完全不熟悉啊~~
哼唧唧
php是世界上最棒的语言!
额…………………………………..楼上说得对
这,都是从入门到放弃,只需要5s秒吗
呵呵,直接CPU干烧了
不至于 不至于
我也觉得楼上说的对~哈哈。博客我已经好久没折腾了,太懒了
我这是有点强迫症犯了,另外昨天的时候有问题,获取不到最新数据,就很抑郁。
哈哈,作业就是这样变成了五花八门,绽放光彩。
是哒
奇怪,为啥我的没你这个问题,你这个我完全折腾不来哈
可能跟套了cdn有关系 内网部署的 没cdn出不来
把空格处理了吗?比如我那条“前言Miblo”,“前言”后面应该有个空格的。我还以为我 RSS 出问题了,特地检查一下
没有专门处理空格 基于python的 beautiful soup实现的自动处理获取文本。
好看,图标都取下来了,我也想学习下,保存图标~
图标是freshrss自动拉取的,也有拉不到的。
现在用的 友链朋友圈 项目好久没有维护了,很难部署成功,docker部署好像还有些问题,不过姐好nb
一般能用的话就不要折腾了。每次折腾太费时间了。
这不是抄作业了,这是学霸
高级版抄作业。
看的我也想做一个好友圈了,但我太懒了,甚至我连rss都还没做。。。
来开始做吧,也没那么难呢,开始了一切就都迎刃而解了
给女王大人献上膝盖,不是,你这不是抄作业啊,这把原来作业反复做几遍,地主家的牛都没你有这劲头。
有没有可能我就是地主家的🐂
好好好,不愧是学霸抄作业
就说抄的好不好吧~~😁
嗯,感觉比PHP稳定一些 恭喜竣工
比 php 版本增加了一些处理逻辑,稳定性应该差不多。
经不住你们的诱惑,终于搞定了 回头再试试集成插件 方便管理
等我去瞅瞅~~
哪里呢,怎么没看到
你的python是玩得真溜呢,这个作业感觉都被你们玩出花来了。
论“回”字的四种写法~~
真不错👍
人生在于折腾,嘎嘎
一起源头好像都是指向我写的哪篇烂文章
始作俑者?
就是那篇freshrss的搭建,不算是吧,只是最近搭建都是挺喜欢搭建的,特别是在主题模板上输出
嗯嗯 搭建东西也满费时间的。
通过代码拉取到的rss数据始终是缺的,是不是有些网站有feed,但是获取不到显示不出来?
获取到了,可能跟缓存有关,现在把所有的缓存都关闭了。
昨天看了这个很感兴趣,自己用chatgpt写了一个,纯基于wordpress现有的函数和变量的PHP代码,不借助FRESHRSS等第三方,设置了2个小时的缓存,2小时候刷新重新获取。
https://my1981.cn/friends.html
源码:
https://my1981.cn/friends.txt
这个方法也想过,奈何写世界上最好的语言能力不行。所以就变通了一下。
的确更简单方便
报错了
Fatal error: Uncaught Error: Class "Thread" not found in /www/wwwroot/my1981.cn/wp-content/themes/pix/page/friends.php:98 Stack trace: #0 /www/wwwroot/my1981.cn/wp-includes/template-loader.php(106): include() #1 /www/wwwroot/my1981.cn/wp-blog-header.php(19): require_once('...') #2 /www/wwwroot/my1981.cn/index.php(17): require('...') #3 {main} thrown in /www/wwwroot/my1981.cn/wp-content/themes/pix/page/friends.php on line 98
代码恢复了,本来想着用多线程,结果定义不了,恢复单线程了,还是2个小时,第一次访问可能慢些,friend.txt的代码也更新了。
感谢分享
我也部署了,好奇怎么可以不限制文章数量而且用分页的方式显示
这个需要在 php 代码里实现分页逻辑,不过这个基于 freshrss 的做分页感觉也没太大意义~~
哈哈,主要是我弄得博客圈想要展示,我试了好几种方法,然而点击翻页不动,是跟环境有关系吗
看下页面点击有没有绑定链接,或者是不是绑定的链接无效。
跟环境应该关系不大。
你这个分页https://www.duanxiansen.com/article.html?page=2 点击之后重定向到https://www.duanxiansen.com/article.html 参数没生效,你可以看下跳转后的地址栏