再战朋友圈
本文是《技术相关(共39篇)》目录的第 39 篇。阅读本文前,建议先阅读本文前3篇文章:
朋友圈从开始前前后后经历了几次改造,前天晚上决定还是换一种方式。原因如下:部分友链网站更新并不及时,个别已经一年未更新,并且朋友圈前台速度我也一直不满意,趁这次修改,把解析友链网站RSS的逻辑也变更了一下。
新逻辑如下:解析单个友链网站前5篇文章,一旦获取成功,该站解析进程立刻终止。并且这5篇文章只保留网站名称、站标、文章标题、文章链接及发布(更新)日期,其它项目及5篇文章以后的全部删除,依然保存在rsscache目录下。待所有网站获取成功后,按照发布(更新)日期进行排序,一旦数量达到30篇,所有流程结束,后面的文章全部忽略,以卡片的形式只显示前30篇。
这样的好处是,以前都是解析所有友链网站的整个rss文件,少则几十KB,多则二百多KB,现在都在5KB以内。尽管前台显示速度还是没有达到我要的效果,不过比之前算是有了质的飞跃。
改造后的代码如下:
沉沦
你的站就不提供全文摘要,所以我就通过 p 标签来提取全文,然而你边栏也有 p 标签包裹的文字:Luohe,Henan打工仔Worker 所以你的文章每篇前面都带有这个😂
似水流年
确实要缩小P标签的范围。
沉沦
现在这个效果不错啊,我一直在犹豫还要不要保留摘要...主要是有的博客并不提供全文摘要,有的文章可能就一句话就没了...造成摘要截断行数不足四行。如果通过 css 过滤器获取完文的话,获取的全文格式又五花八门还要再次过滤,真的是人都麻了~
似水流年
这就是我去掉摘要的原因。
刘郎
我看看你咋弄的 哈哈
似水流年
不停的折腾😸
acevs
mark有个印象。
似水流年
欢迎mark
obaby
你把每个站点单独存了啊?我就写到了一个文件里面。
似水流年
是的,单独存放了,没有放到一个文件里。本来想着json格式的,但是没成功。