WorkBuddy · 内容创作与发布分析系统

一个人的
小红书内容生产闭环

基于 WorkBuddy 把"素材采集 → 选题生成 → 内容生产 → 内容改写 → 发布计划 → 数据回收"
6 个环节串成一个真实跑过 4 个月的闭环,让一个人能像团队一样持续产出小红书精品内容。

2982
4 个月真实粉丝增长
6
闭环环节全打通
14
多源素材爬虫
游戏雷达局 · 小红书账号主页
真实账号 · 4 个月运营 · 2,982 粉丝 / 1.2万 获赞收藏
一个必须先说清楚的事

这个账号 不是 AI 做出来的。
AI 只负责 跑腿

判断、温度、节奏、视觉、口吻——全部由人定
AI 帮我节省了 60% 的素材搬运、初稿撰写、调度时间,但
「这条选题要不要做」、「标题怎么改才有钩子」、「封面留哪一帧」——
这些决定 80% 点击率的事,AI 一个字都不出。

人工参与比例 账号精品程度
素材采集
30 : 70
选题判断
75 : 25
内容初稿
40 : 60
文案精修
90 : 10
标题 / 封面
95 : 5
发布调度
25 : 75
数据复盘
65 : 35
人工 AI — 4 个月真实运营拆出来的占比,不是估算
PROBLEM

个人创作者的 4 个核心痛点

赛题原文:"素材分散、创作流程割裂、内容质量不稳定、数据反馈难闭环"。我们 4 个月真实运营踩过每一个。

PAIN 01
素材分散在 N 个工具里
Reddit 看了截图、B 站存了收藏夹、TapTap 开了 20 个标签——回头都找不到。
PAIN 02
创作流程割裂
文案在 Notion,配音用 Edge,剪辑用剪映,封面打开 PS——一条片切 5 个工具。
PAIN 03
质量不稳定
这周写得好,下周就崩;爆款无法复用,踩坑反复踩。
PAIN 04
数据反馈难闭环
知道某条爆了,但不知道为什么爆;下次选题靠拍脑袋。
ARCHITECTURE

6 环节闭环 · 全部跑通

每个环节对应一个独立模块。WorkBuddy 是"对话主导"层——它读 skill 文档、跑命令、处理错误,运营全程不敲命令。

01 · MATERIAL 素材库构建 crawler/ · 14 scrapers 02 · TOPIC 选题生成 规则评分 + AI 精排 03 · CREATE 内容生产 creator/ · 6 skills 04 · REWRITE 内容改写 + 事实核查 qwen-max · fact_check 01+ · BENCHMARK 对标账号监控 benchmark/ · playwright 05 · PUBLISH 发布计划 草稿箱 · 多平台导出 ★ 06 · DATA REVIEW 数据回收 → 反哺选题 analytics/ · CSV → SQLite 闭环关键节点 ★ 反哺
主流程 对标补充 数据反哺(闭环关键) 质量保障(事实核查)
MODULES

5 个核心模块 · 各自能跑也能串成闭环

每个模块在仓里对应一个独立子目录,有自己的 README 和入口命令。snapshot 模块来自日常生产仓,新写模块 100% 本仓自给自足。

01 / SNAPSHOT
crawler/
snapshot · D:/project/content-monitor
14 个 scrapers 多源素材采集(Reddit / 微博超话 / B站 / TapTap / 触乐 / 游民 / Epic / Steam / eShop / ...)+ 双路径改写 + 视频流水线 + fact_check。
环节 1 环节 4 9 MB · 已 snapshot
02 / SNAPSHOT
creator/
snapshot · xhs_console_agent
6 个独立 skill 的对话式生产流水线:素材采集 / 文案 / 配音(Edge TTS 9 音色) / 剪辑 / 封面 / 图文笔记。配套对话主导的运营操作手册。
环节 3 6 skills · WorkBuddy 协议
03 / NEW
benchmark/
新写 · playwright + XHR 监听
对标账号监控。不依赖 Agent-Reach / OpenCLI / 任何外部 CLI,自己写 playwright 直驱,**不登录、不暴露你账号**——靠游客 session 拉首屏笔记。已实测 11 条全拿到。
已实测跑通 环节 1+ 零登录
04 / NEW · ★
analytics/
新写 · 闭环关键节点
数据回收闭环。CSV → SQLite → 互动率/时段/标题分析 → qwen-max 出周复盘 → 选题反哺到 02-script-writer skill。一条命令端到端跑通。
已实测跑通 环节 6 SQLite · qwen-max
05 / DOC
docs/操作手册.html
运营入门手册(团队内部已验证)
"对话主导"操作手册:教运营怎么和 WorkBuddy 说话,配示例图。"新人第一天到岗,半小时能独立出片"。
复用性高 非工程师可读
06 / RENDER
analytics/_vendor/
单文件 vendor · render_xhs_cards
复用 xhs-weeklyreport 的双风格卡片渲染器(暗黑 #0C1520 + 奶油 #FFFDF9)。一份分析数据 → 双风格 HTML,浏览器导 JPG 直接发布。
复用 375×500 卡片规范
07 / NEW
creator/motion-remotion/
新写 · React + Remotion 动效视频
代码驱动的动效视频生成。2 个示例 Composition:4 个月增长动画(28 秒)+ 周复盘卡片动画(26 秒)。1080×1920 竖屏,npm run dev 实时预览,npm run build 一键 render。
已渲染验证 环节 3 补充 React 18 · TS 5
WHAT MAKES IT DIFFERENT

4 个真实跑出来的差异点

每一条都不是 PPT 画饼,是 4 个月运营实际踩坑沉淀的工程纪律。

01

双路径改写 + fact_check 事实核查

所有 AI 生成的文案在进入"图文生成"或"视频生成"前自动跑 fact_check_content(),黄色弹窗逐条列出无源断言,一键返回修改。

W17 编了"中国市场已成为卡普空核心增长极"——无源断言。
W21 同一类错误又犯。从那时起所有改写都先过 fact_check,编错率 30% → < 5%。
02

Skill 协议 + 对话主导操作手册

WorkBuddy 在项目目录里读 SKILL.md,自己跑命令、自己处理错误。运营全程不敲一行命令。

新人第一天到岗,看完 docs/操作手册.html,半小时能独立出片。
这套架构换一个题材(不止游戏)就能跑。
03

数据回收 → 选题反哺闭环

analytics 模块出的 next_week_prompt_W{N}.md 末尾自动生成 WorkBuddy 触发话术,复制粘贴回 creator 即可起一轮新生产。

"基于阅读/互动数据优化下一轮选题"—— 赛题原话。
从样本数据自动识别出 22:00 是黄金时段、16-20 字标题最优。
04

对标监控不登录、不暴露账号

benchmark 自己写 playwright + XHR 监听,靠浏览器自动建立的游客 session就能拉对标账号首屏笔记。不要 Agent-Reach、不要 OpenCLI、不要 cookie。

已实测:监控小红书 TapTap 官方账号,11 条笔记全部拉到,含标题/点赞/封面/置顶。
fresh chromium context 每次新游客身份,反爬识别概率最低。
LIVE DEMO

实跑输出 · 不是 mock

下面两段是真实跑出来的终端日志(脱敏样本数据 + TapTap 公开主页),可在仓里复现。

analytics/ · python cli.py --import ... --analyze --suggest --render
# 一条命令端到端跑通 $ python cli.py --import examples/sample_export.csv \ --analyze --suggest --render [import] 检测到字段映射: {笔记ID, 标题, 发布时间, 浏览量, ...} [import] 导入笔记 30 条;快照 30=== 整体面板 === 笔记总数: 30 总阅读: 222,860 整体点赞率 7.93% 收藏率 9.9% === 互动率 Top 5 === 1. [23.02%] 魂系新人怎么选|从血源到艾尔登法环 2. [22.54%] 2026目前最值得买的5款国产单机 3. [22.17%] Switch 2评测出了|首发买不买 === 发布时段分布 === 22:00 4 笔 平均互动 20.1% ←最佳 === 标题长度 vs 表现 === 16-20字 15 笔 平均互动 19.15% ←甜点区 [suggest] 调用 qwen-max 生成下期选题候选 ... [suggest] 事实核查 检测到 2 条未发生事件 [suggest] 已写入 next_week_prompt_2026-W27.md [render] 已写入 W27_dashboard.html ↑ 双风格卡片报告,浏览器导 JPG 即可发布
benchmark/ · python monitor.py --user-url ...
# 监控小红书 TapTap 官方账号 · 不登录 $ python monitor.py --user-url \ "https://www.xiaohongshu.com/user/profile/5b6919df..." [monitor] 页面标题: TapTap - 小红书 [monitor] 监听到的相关 XHR 端点 (10 个): - .../api/sns/web/v1/login/qrcode/create - .../api/sns/web/v2/user/me ← guest session 初始化 - .../api/sns/web/v1/user_posted?... code:0 [monitor] 提取到笔记 11# 按点赞排序: 6565 赞 纸嫁衣9 限免段·7月16日上线! 5303 赞 女团公司 × 骑士护盾局 PPT版 127 赞 TapTap 游戏发布会,全片合集了! 104 赞 首款AI国创大作《Steam页面》 95 赞 你们摆烂1块的样子... [置顶] 59 赞 TapTap游戏发布会,50+款游戏即将登场! ... [monitor] 已写入 data/TapTap_20260629.json ↑ 反哺到 analytics 做"对方在打但我没打"分析
精品账号的"精品感",
AI 该退场 的地方。
环节
AI 用得多吗
为什么
素材采集
✓ 多
重复劳动,AI 节省 80% 时间
选题生成
△ 中
AI 出候选,人手做最终判断
内容生产(一稿)
✓ 多
起草是效率核心
内容改写(精修)
✗ 少
温度、节奏、口吻必须人手过
标题 / 封面
✗ 少
决定 80% 点击率,人手专属
发布计划
✓ 多
调度劳动
数据复盘
△ 中
AI 出建议,人手定方向
TECH STACK

技术栈

没有花哨的依赖,全部围绕"git clone 一个仓就能跑通"设计。

RUNTIME
Python 3.11
stdlib 优先
AI
qwen-max / turbo
DashScope · OpenAI 兼容
SCRAPING
playwright 1.58
XHR 监听 · stealth
STORAGE
SQLite
stdlib · 跨周时间序列
WEB
Flask
crawler 监控面板
VIDEO
edge-tts · MoviePy
9 音色 · imageio-ffmpeg
RENDER
html-to-image
浏览器侧 JPG 导出
UI 协议
SKILL.md
WorkBuddy · Anthropic 协议兼容
SOURCE CODE

关键文件索引

每个文件都跟它在赛题里的角色一一对应。点开看代码即可验证。

路径
角色
关键依赖
analytics/cli.py
一键入口 · import / analyze / suggest / render 串起来
argparse · sqlite3
analytics/csv_importer.py
小红书创作中心 CSV 解析 · 列名 autodetect · 容错(万/k/逗号)
csv · 中英双语别名
analytics/schema.py
SQLite schema · notes / snapshots / followers 三表 · 跨周时间序列
sqlite3 stdlib
analytics/analyzer.py
互动率 / 时段 / 标题模式分析 · pretty print 中文报告
collections.defaultdict
analytics/qwen_bridge.py
桥接 crawler/content-monitor/qwen_client.py · 复用 19 个 AI 函数
sys.path import
analytics/topic_recommender.py
qwen-max 出 5 条选题 + 自动 fact_check + WorkBuddy 触发话术
qwen-max · prompt engineering
analytics/report_renderer.py
分析结果 → cards JSON → 双风格卡片 HTML
vendored render_xhs_cards
benchmark/xhs_scraper.py
playwright 直驱 · XHR 监听 · 游客 session · cover URL fallback ID
playwright sync · stealth
benchmark/monitor.py
CLI 入口 · 含 --browse 找 URL 工具模式
argparse
crawler/content-monitor/qwen_client.py
19 个 AI 函数(生成评测 / 改写 / fact_check / 周报文章 / ...)
openai SDK · DashScope
crawler/content-monitor/scrapers/*.py
14 个独立 scraper · Reddit / 微博超话 / B 站 / TapTap / 触乐 / ...
requests · feedparser · playwright
creator/xhs_console_agent/skills/*/SKILL.md
6 个 skill 协议文档 · WorkBuddy 自动读取并执行
Anthropic SKILL 协议
creator/motion-remotion/src/Root.tsx
Remotion 入口 · 注册 GrowthAnimation + WeeklyDashboard 两个 composition
React 18 · Remotion 4
creator/motion-remotion/src/compositions/*.tsx
数据可视化动效(增长曲线 / 周复盘)· 1080×1920 竖屏
spring · interpolate · SVG
完整代码 + 提交历史在 GitHub
git clone https://github.com/756496019-lgtm/xhs-ai-operation.git
在 GitHub 打开