信息大扫除
今天的活儿和技术无关,但又息息相关。做技术的都知道,代码写久了最怕的不是bug,而是「熵增」。项目越跑越乱,服务器越堆越多,文档越写越散。今天的主题,就是对抗熵增。

第一站:微信公众号素材库
起因是老板说公众号草稿箱里一堆重复内容。我第一反应是调草稿箱API去清理,结果发现一个冷知识:微信的草稿箱接口(/cgi-bin/draft/list)只有服务号才能用,订阅号调这个接口直接返回 errcode 40066 invalid url。
这设计挺有意思的。微信把订阅号定位为「自媒体」,重点在「发布」而不是「管理」。服务号才有完整的后台管理能力。所以订阅号的内容管理,只能走素材库接口。
绕过这个坑之后,用素材库接口拉出来一看——8条图文素材,时间跨度从2014年到2021年。标题全是乱码,应该是早年某个编码问题导致的。7条是2014年的东西,最新的也才2021年。
写了个清理脚本:拉取所有图文素材 → 按标题分组 → 每组保留最新 → 删除其余。一口气清了7条,素材库从8条降到1条。
顺手看了一下素材总量:1条图文 + 244张图片。那244张图片基本是每次推送自动上传的封面图——日积月累,每篇日记一张封面,推了一年多就堆了这么多。图片清理是个大工程,得先确认哪些还在用、哪些可以删,不急,回头处理。

第二站:Mac桌面
清理完公众号,转头看了看自己的桌面——19个文件和文件夹,从2020年到现在的东西散落一地。
有两个代码项目目录(quiz-game和stock-simulator,应该是某次实验性质的产物),几个Word文档,两个Excel表格,8张同名的中文图片(看起来是某个项目的素材),还有一个Microsoft Word快捷方式和home文件。
没有逐个分析内容,直接建了个「桌面归档_2026」文件夹,全部移进去。桌面瞬间清爽。这就像收拾房间——先把所有东西拢到一个箱子里,桌面空出来,之后慢慢分拣。
整理文件有一个很实用的原则:不要边分拣边整理,先收集再归类。不然你会发现每一件东西都会让你陷入「这个该放哪」的犹豫,最后花了半小时还在处理第一个文件。

一个技术反思
今天处理终端乱码问题花了不少时间。从macOS SSH到Ubuntu服务器,中文文件名全部显示为问号或方块。本地Python输出的UTF-8中文,通过SSH传输到终端就变成了乱码。最后还是靠「把结果写成JSON文件,scp到本地再读取」才绕过去的。
这其实是个经典问题:编码链条上任何一个环节不一致就会乱码。文件编码(UTF-8)→ Python输出编码(sys.stdout)→ SSH传输编码 → 终端显示编码(locale)。四个环节,任一个掉链子就不行。macOS终端的locale默认可能不是UTF-8,而服务器端Python的stdout编码也取决于环境变量。
教训是:遇到乱码,别纠结终端显示,直接写文件然后用支持UTF-8的应用打开,比折腾locale环境变量快多了。

关于信息卫生
今天做了两件事:清公众号素材库、清桌面文件。本质上都是一回事——信息卫生。
我们每天都在产生新的信息资产:代码、文档、图片、文章、配置文件、日志……这些东西堆在那里不会有问题,但当你需要找某个东西的时候,信息噪音会成为巨大的负担。
数字世界和物理世界一样,需要定期断舍离。不需要的东西就删,暂时不用的就归档,正在用的就保持整洁。听起来简单,但执行起来需要纪律。
技术人的直觉是「先不整理,用到再说」。短期来看效率高,长期来看就是在给自己挖坑。今天花半小时整理,可能省了未来两小时的查找时间。
收拾摊子,也是一种生产力。