news 2026/5/27 9:43:20

MiMo送820亿Tokens?!只有3天,时间紧,任务重!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MiMo送820亿Tokens?!只有3天,时间紧,任务重!

MiMo 送的 16 亿好不容易消耗了 25%~ 早上一看变成满血 820 亿了!

牛逼,数字越来越离谱了,我数零都数了好久,能不能帮我换成钱啊?

这是不是受到了 DeepSeek 永久 2.5 折的刺激啊?!

关键的问题是这个月只有 3 天了,这个重置 + N 倍配额是否有点……!

cc1fbe83-4fb9-4217-9c01-9078760db048-crop

虽然这个 Tokens 纯度不太高,但是量是真的大!

接下来,就是终极一问:如何在3天内消耗820亿了???

上一篇我讲了,我询问不同 AI,如何快速消耗 Tokens!

后来给了我就制作了一个武侠百科《江湖百晓生》,MiMo 做的没法用。

然后还做了一个文档网站。把 Claude 的 API 文档一口气全给拉到本地了。

然后用 MiMo 翻译成中文文档!

这个事情还挺消耗 Tokens,MiMo 的结果还是能看的,至少比全英文的好多了。

今天就来讲讲这个使用场景吧!

然后记录一下:我是如何使用 Opus4.7 结合 MiMo 来构建这个网站的。

优质 Tokens + 普通 Tokens 打组合拳,不浪费一个 Tokens。

1、Opus 负责高难度任务!

我们先让Opus完成最难的部分。分析网站,抓取内容,建立架构!

我们先来看一下 Claude 官方的网站:

这个网站数据量还是不小的,而且基本上是全英文的状态。虽然它提供了中文选项。但是中文内容严重缩水,残缺。

抓数据其实是个老学科了,但是现在也会有各种问题,有些网站是根本抓不到数据的。所以我第一步是问了一下能不能抓到数据。

Opus说可以看到!

然后开始上我的需求了:

我计划在当前项目目录下创建一个 `claude/api` 文件夹,用来搭建一套 Claude API 文档的本地化资料库。 我的目标是把官网上的 Claude API 文档,按照网页原本的菜单结构下载到本地。这个网站有一个很方便的特点:每个页面都可以通过在网页地址后面添加 `.md` 后缀,直接获取对应的 Markdown 文件。 因此,我希望先基于官网的菜单列表和页面结构,把这些 Markdown 文档下载下来,并按照原网站的层级关系保存到本地。默认下载英文版本,也就是 `en` 版本。 在英文原版文档整理完成之后,我还希望基于英文版再生成一套中文版本,也就是 `cn` 版本。中文版的目录结构应该和英文版保持一致,只是内容翻译成中文。这样可以方便后续对照、维护和学习。 最终,我希望基于这些本地 Markdown 文件,制作一个类似官网的本地文档网页。这个网页可以把 Markdown 转换成 HTML,并保留文档结构、导航菜单、标题、代码块、表格、链接等内容,方便我在本地查阅和学习。

Opus 收到需求之后进行了分析。

Opus的分析思路:

1. 探索当前 MyDocs 项目结构,看看你已有的 md→html 框架长什么样(能不能复用) 2. 验证 claude.com 文档站的 .md 接口和目录结构(导航树的获取方式) 3. 估算文档规模和翻译成本 我并行启动两个 Explore agent,再亲自抽取一两个 .md 端点验证。

Opus的分析结果:

探索完毕。整体可行性分析如下: 你的想法评估:✅ 方向正确,但有几个需要决策的细节 # 好的部分(采纳) .md 后缀技巧已验证可用,所有页面都能拿到原始 markdown claude/api/ 占位目录你已经预留好了,与现有 MyDocs 结构对齐 先英后中分两阶段是对的(先确保管线跑通再翻译) # 需要修正的部分 不是纯 CommonMark,是 MDX:返回的 .md 文件包含 <Card>、<Tip>、<Steps>、<Tabs>、<CodeGroup> 等 JSX 组件标签。常规的 markdown-it / marked 不能直接渲染,必须做转换映射(mapping 到 styled <div>),否则页面会显示乱码标签。 MyDocs 当前是纯手写 HTML,没有 md→html 管线:hermes-agent 那套是模板,但 ~150-200 页文档不可能手写。需要建一个构建脚本(fetch .md → 解析 MDX → 输出静态 HTML),一次性生成全部页面。 侧边栏导航需要单独抓:sitemap.xml 有所有 URL,但没有 "Build with Claude > Messages API" 的分组顺序。需要从 /docs/en/intro 页面抓 sidebar HTML 或试 llms.txt。 # 规模数据 英文文档约 150-200 页,原始 markdown 5-15 MB 多语言官方有 11 种(含中文),但官方中文质量不确定,自己翻译可能更可控 # 推荐的改进版方案 把整个流程脚本化(Python 单脚本,~3 个阶段): fetch_docs.py → 抓 sitemap + 所有 .md,存到 claude/api/_src/en/ build_site.py → MDX 组件 → HTML 映射,生成 claude/api/en/*.html + 侧栏 translate.py → 调 Claude API 批量翻译 _src/en/*.md → _src/cn/*.md (复用 build_site.py 生成 claude/api/cn/*.html) 这样英文站和中文站共用一套构建逻辑,只是源 md 不同。 在写最终方案到文件之前,几个关键决策需要你拍板:

Opus的总结包含了:好的部分,需要改进的部分,数据规模评估,改进方案,最后等我拍板!

然后就给我提了几个问题:

上图已经有完整的问题和我的选择了!

接下来就全部交给 Opus4.7 了。它制作了详细的计划文档,然后开始执行。

执行过程中它发现:

英文文档全量是 1541 页,远超我初估的 150-200。 先验证 MDX 渲染再决定要不要全量。看一眼源文件结构: ...

这个数据量确实有点太大了,我一口气吃不下,而且我不确定这些文档是否有用。我让它分析了一下,其中 1197 篇属于不同语言的 SDK 文档。我可能用不上,就先不抓取了。

最后的汇总信息如下:

# 汇总(sitemap 1541 · 已抓 381 · 未抓 1197) # Part 1 — 已抓(按 tab / group) ├ Tab: Messages (72) — 10 个 group 完整展开 ├ Tab: Managed Agents (30) ├ Tab: Admin (25) └ Tab: Resources (263) ← 含 REST API endpoints 全部 # Part 2 — 未抓(1197,9 SDK × 133) ├ Python SDK (133) ← <details> 折叠 ├ TypeScript SDK (133) ├ Java SDK (133) ├ Go SDK (133) ├ Ruby SDK (133) ├ C# SDK (133) ├ PHP SDK (133) ├ CLI (133) └ Terraform (133) # Part 3 — 后期补抓指引(含代码模板)

总共抓取了 381 个页面!

这个过程非常丝滑,没遇到任何问题,也没遇到频率限制。

Claude 官网是构建在 Mintlify 上面的,我不清楚它的防抓策略如何。反正 Opus 轻松搞定了!

它帮我构建的目录结构如下:

claude/api/ ├── index.html 语言切换入口(en / cn 卡片) │ ├── en/ ← 构建产物:英文站 │ ├── index.html 英文落地页(tab 卡片列表) │ ├── intro.html │ ├── get-started.html │ ├── build-with-claude/*.html │ ├── agents-and-tools/tool-use/*.html │ ├── managed-agents/*.html │ └── manage-claude/*.html │ ├── cn/ ← 构建产物:中文站(结构镜像 en) │ ├── _src/ ← 源 markdown(进 git,不上线) │ ├── nav.json 抓取得到的导航树 │ ├── en/*.md 上游原始 MDX │ └── cn/*.md 中文版(初期为英文占位) │ ├── _build/ ← 工具链 │ ├── package.json Node 依赖清单 │ ├── fetch.mjs 抓取脚本 │ ├── build.mjs MDX → HTML 构建器 │ ├── translate.mjs 中文骨架生成器 │ ├── components.mjs MDX 组件 React 实现 │ └── templates/ │ ├── page.html 文档页外壳 │ └── landing.html 落地页外壳 │ └── _assets/ ← 浏览器加载的样式与脚本 ├── docs.css └── docs.js

同时帮我创建了四个脚本:

脚本输入输出何时跑
fetch.mjsplatform.claude.comHTTP_src/en/*.md+_src/nav.json想刷新上游内容时
build.mjs [lang]_src/<lang>/*.md+nav.json<lang>/*.html+ landing改了源、模板或样式后
translate.mjs_src/en/*.md_src/cn/*.mdfetch 后一次即可
inventory.mjssitemap.xml +nav.jsondocs/claude-docs-url-inventory.mdfetch 后想看完整 URL 列表

还挺贴心准备了命令速查:

cd claude/api/_build # === 抓取 === node fetch.mjs # 默认: 11 页 allowlist (开发用) node fetch.mjs --tab=messages # 单 tab 全部 (~72 页) node fetch.mjs --tab=managed-agents # ~30 页 node fetch.mjs --tab=admin # ~25 页 node fetch.mjs --tab=resources # ~38 页 (不含 EXTRAS) node fetch.mjs --all # 4 个 tab sidebar 全部 (~155 页) node fetch.mjs --all --with-extras # ↑ 再 + EXTRAS (sitemap 补抓) = 381 页 # 调节速率(默认 concurrency=3 delay=150ms) node fetch.mjs --all --with-extras --concurrency=2 --delay=250 # === 构建 === node build.mjs en # 输出 en/*.html node build.mjs cn # 输出 cn/*.html # === 中文骨架(仅复制,无 LLM)=== node translate.mjs # === 一条龙:fetch + build en + scaffold cn + build cn === npm run all # === 重新生成 URL 清单(汇报工具,不抓取)=== node inventory.mjs # 输出 docs/claude-docs-url-inventory.md

通过脚本,可以指定抓取内容,可以快速根据MD文档构建网页,然后也可以进行翻译,也可以一条龙运行。

因为它考虑到翻译的 Tokens消耗 量比较大,所以它暂时没有做 ,留空了!

它不想浪费自己的 Tokens~~

所以它的活,到这里就结束了:

总共修改 20 万行内容!

目标网站分析报告,执行报告,和汇总报告全部做好了!

当然源代码也全部写好了,尤其是把 MDX 到 HTML 的转换器也写好了。

我只要一个命令,就可以快速把所有MD文档转换成HTML网页!

可以快速构建一个纯静态的 Claude 文档中文镜像网站。

有了这些资料,只要是 Claude 相关的问题,AI 就可以精准执行了!

2、MiMo 负责高消耗任务!

接下来就轮到 MiMo 上场了!

现在问题已经非常清晰了,Opus4.7 已经把所有结构都做好了。而且把所有文档放在cn目录下面了。

我只要让 MiMo 读取这些文档并翻译即可。它只做这一件事情!

后续执行一下 Opus 的脚本就能转换成网页了!

具体的操作就是打开 JCode:

然后把cn这个目录拖动到 Xiaomi 这个图标!

这样就可以直接打开 Claude Code 了:

模型和 API 相关数据已经自动配置完成了!

接下来的事情就非常简单了!

只要告诉他:“帮我读取所有文件,把其中的英文文档翻译成中文”!

然后就不用管了,它会自己读取文件,自己判断,直接管理多个智能体并行翻译!

大概花费了几个小时,几百个文档全部翻译完成。消耗了几个亿的配额,16 亿中的 25% 消耗完了!

这个组合还不错!

现在 AI 能力非常强,唯一缺少的就是新的或者准确的知识。

所以构建一个专门给自己或者 AI 的知识库非常重要!

正好,现在不差 Tokens,把各种文档都捞一波,然后做成中文版。

英文的 MD 文档给 AI 看,中文网页方便自己看,完美!

我也有计划把我完整的文档库分享出来:

目前还只是有一个想法,内容还没做好~~!这种事情急不来,只能慢慢来!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 9:43:08

5分钟快速上手:BetterNCM插件管理器一键增强网易云音乐体验

5分钟快速上手&#xff1a;BetterNCM插件管理器一键增强网易云音乐体验 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer BetterNCM插件管理器是一款专为网易云音乐PC客户端设计的智能安…

作者头像 李华
网站建设 2026/5/27 9:43:06

InsForge CDN配置:静态资源加速与缓存完整指南

InsForge CDN配置&#xff1a;静态资源加速与缓存完整指南 【免费下载链接】InsForge The all-in-one, open-source backend platform for agentic coding. InsForge gives your coding agent database, auth, storage, compute, hosting, and AI gateway to ship full-stack a…

作者头像 李华
网站建设 2026/5/27 9:42:31

用了多语言 embedding,为什么还是查不到?

前端出身&#xff0c;跨进智能体这个坑已经有一段时间了。写这个系列&#xff0c;是想把自己摸索的过程留下来——不是教程&#xff0c;是记录。同在学习路上的&#xff0c;也可以看看我整理的电子书&#xff1a;book.zyh.lol&#xff0c;共勉。 用户问&#xff1a; “怎么配置…

作者头像 李华
网站建设 2026/5/27 9:40:58

物联网智能园艺系统:双植物自动化养护与轮值调度实践

1. 项目概述&#xff1a;当园艺遇上自动化 “全自动网站”这个项目&#xff0c;听起来像是技术极客的玩具&#xff0c;但当你把它和“Bramble & Thorn”&#xff08;荆棘与刺&#xff09;这个充满野趣的名字&#xff0c;以及“首个双植物轮值日”结合起来时&#xff0c;事情…

作者头像 李华
网站建设 2026/5/27 9:39:58

如何用BetterNCM安装器5分钟解锁网易云音乐隐藏功能

如何用BetterNCM安装器5分钟解锁网易云音乐隐藏功能 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 还在为网易云音乐的功能限制感到烦恼吗&#xff1f;BetterNCM安装器是你的终极解决…

作者头像 李华
网站建设 2026/5/27 9:39:58

终极指南:如何用免费PlantUML编辑器快速绘制专业UML图表

终极指南&#xff1a;如何用免费PlantUML编辑器快速绘制专业UML图表 【免费下载链接】plantuml-editor PlantUML online demo client 项目地址: https://gitcode.com/gh_mirrors/pl/plantuml-editor 你是否厌倦了在传统绘图工具中反复拖拽调整UML元素&#xff1f;是否希…

作者头像 李华