news 2026/4/6 10:45:33

又一个王炸!电脑接入这个编程大模型,几句提示词,就开发了个短视频生成智能体,真的太赞了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
又一个王炸!电脑接入这个编程大模型,几句提示词,就开发了个短视频生成智能体,真的太赞了!

你好,我是郭震。

最近很多读者跟我后台反馈过一个问题,相信也是大家普遍遇到的、长久以来的一个痛点,什么痛点呢?

想给自己做一个全栈项目,去问AI大模型,得把文件一个个复制进去,改完了再一个个粘贴回来,稍微复杂点的项目直接报错,结构全乱。

有些项目写个简单的网页(HTML/CSS)还行,一旦涉及到后端、复杂的工程逻辑,或者换个像 Go、Java、C++ 这样的语言,AI 往往就“露馅”了。

今天这篇文章,我来分享下如何用MiniMax最新发布的M2.1解决这类问题,感兴趣的可以看看这篇。

1. 作品展示

一句提示词,直接在自己电脑生成带有完整项目结构的代码,如下图所示我做了一个复古程序员风格的简历网站,打开后进入系统,如下GIF图所示正在加载:

这种流星雨式的风格,和程序员太贴切了,还能和它交互,比如输入help看到简历选项,输入about显示信息如下GIF所示:

再按下enter进入到下面展示界面,当面试官看到这样一位候选者简历,会不会被折服😄:

这是在我电脑终端输入一句提示词,直接把上面简历网站写入到我的磁盘目录下,如下图所示,不是所有东西全堆到一个HTML文件中,而是生成一个完整工程结构、多个代码文件:

除了从零生成项目代码外,很多读者关心的基于一个现成代码仓库,修复bug,新增功能等,基于最近做过的一个短视频生成智能体项目,得有100个以上的TypeScript等文件:

这是现有代码对应的自媒体视频生成智能体,界面展示:

我想增加生成不同视频比例功能,如下面红框所示,基于本文介绍的方法,几句提示词,就在我现有含100多个代码文件的仓库基础上修改好了,效果如下图所示:

这应该是AI时代,代码开发的正确姿势,下面介绍我做出上面作品的详细方法,感兴趣的继续看下去。

2. 从零开发方法介绍

我使用的是Claude Code编程终端神器,接入的是MiniMax M2.1,这家模型和之前我接入过的其他模型最大不同,就是它 “懂工程”。

现在很多大模型,都像个初级实习生,编写单个文件,单个文件中找bug都没问题。但是能像个资深软件工程师(SWE-agent),写出带有完整项目结构的代码,并能从几十上百的文件中定位bug的,不是很多。

能做到的,说实话,API费用又太高,动辄几十美金,性价比太差。在这其中MiniMax家,刚升级上线了M2.1,能从我上百个文件的代码仓库中增加功能,花费相比其他如Claude就很好,29元coding plan,不到5美金,相比Claude Opus4.5简直是白菜价,但是性能上感觉差不太多。

所以接下来,我就来详细总结下,最新的MiniMax M2.1接入Claude Code,国内也能丝滑使用,一句提示词开发出文章开头网站,以及如何基于现有项目扩展功能。

第一步,进入下面网址:

https://platform.minimax.io/docs/guides/models-intro

选择箭头所示MiniMax M2.1模型:

获取到自己的API Key,然后填入到下面文件中:

{ "env": { "ANTHROPIC_BASE_URL": "https://api.minimaxi.com/anthropic", "ANTHROPIC_AUTH_TOKEN": "<YOUR_API_KEY>", "API_TIMEOUT_MS": "3000000", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1, "ANTHROPIC_MODEL": "MiniMax-M2.1", "ANTHROPIC_SMALL_FAST_MODEL": "MiniMax-M2.1", "ANTHROPIC_DEFAULT_SONNET_MODEL": "MiniMax-M2.1", "ANTHROPIC_DEFAULT_OPUS_MODEL": "MiniMax-M2.1", "ANTHROPIC_DEFAULT_HAIKU_MODEL": "MiniMax-M2.1" }}

配置路径为:~/.claude/settings.json,编辑界面如下所示:

保存后,再在终端输入Claude,就会看到MiniMax-M2,虽然显示的是M2,但是咱们上面的截图已配置好了最新的2.1,这是claude的显示问题,不用管:

简单测试下,输入hi,如下图所示正常回复,就表明配置都正确了:

接下来输入一句提示词:

你是一个资深前端架构师。请帮我开发一个“黑客帝国/极客终端风格”的个人简历网站。

然后它就开始工作,开始构思简历配置文件,数据与视图分离,如下图所示:

构思绿色终端主题,如下图所示:

然后开始下个阶段,显示器风格,如下图所示:

合成所有应用逻辑,如下图所示:

最后所有代码文件,写入到我的电脑文件,如下图所示:

完整代码结构就是我文章开头的那个截图。

它自动生成的代码里,CSS 样式、JS 脚本、HTML 结构被拆分到了 src、assets、components 不同目录中。这种工程感,是一个有经验的程序员才有的感觉,这意味着你可以像维护一个真实产品一样去维护这个简历,而不是写完就扔的 Demo。

这正是 SWE-agent 与普通 AI 的本质区别:它不只是在‘写代码’,而是在‘做架构’。这种起手式,直接帮你规避了后续 80% 的维护大坑,这才是真正的工程素养。

3. 复杂项目做“精准手术”

很多读者都有这种感觉,写新项目容易,但手头已经有维护了好几年的老项目,几十上百个文件,使用 M2.1 处理我最近的一个复杂项目,自媒体短视频自动化生成智能体。

这是一个基于TypeScript开发的后端项目,目前已经迭代了100多个文件,逻辑非常复杂,包含了视频合成、语音对接、素材抓取等多个模块。

过往的大模型看到 TypeScript,下意识地就觉得这是在写浏览器脚本,经常会在后端逻辑里给我冒出 window 对象或者 DOM 操作,直接把服务搞崩;更让人头疼的是,它们缺乏“全图视野”,面对我这一百多个文件的架构,往往只会胡乱塞代码,根本不懂什么叫依赖注入、什么叫接口解耦。

不知道M2.1,在处理这方面带有很重后端的项目,是否能做的好。我的需求就是,在不破坏现有架构的前提下,给这个项目增加一个视频画幅的新功能,支持1:1头像,3:4半身视频生成。操作步骤如下所示,首先定位到工程所在目录:

先问它,这是一个什么项目?

它开始分析这个项目,这是我常用的一种方法,我自己叫大模型预热,算是热身阶段。

然后,我就发提示词给它,提示词如下所示:

阅读当前代码,在不破坏原有逻辑的前提下,新增 1:1 和 3:4 两种视频画幅支持。请使用 TypeScript 枚举(Enum)管理画幅类型,扩展现有的 Interface 定义,并确保代码的类型安全和向后兼容性。

如下图所示,M2.1 很快分析上千行代码:

很快准确定位到了关键的代码,并增加了我想要的两种比例,如下图所示:

然后开始写入:

告诉我新增的文件和引入地方:

整个思考过程,比Claude Opus 4.5 推理速度快了很多,到现在整个过程1分29秒:

推理后新增的代码,如下图所示:

右侧面板需要调整的代码文件:

这是2分13秒,距离最后结束只差一点,就把新增加功能,开发完成了,如下图所示:

以上从上百个代码文件中,新增功能是非常考验模型“从 1 到 100”的能力的,它必须读懂我现有的代码风格、工具类引用以及类型定义。

MiniMax M2.1 做到了以下三点,这是普通模型容易翻车的地方:

第一,精准的“手术刀”式修改:它没有胡乱生成,而是准确地在不同文件新增代码。

第二,理解上下文依赖:注意看截图,它自动引入了我项目中已经封装好的MiddlePanel, RightPanel面板模块。它知道“入乡随俗”,沿用了我原本的工程习惯,而不是自己造轮子。

第三,TypeScript 类型安全:它定义的接口(Interface)完美契合我现有的类型系统,没有出现 any 满天飞的情况。

代码直接跑通,新增功能对应的视频,如下图所示,限于篇幅,我截取了几帧,感兴趣的可以看看:

综合来说,M2.1 这次给我的感觉不太一样。它像是一个读过我所有源码的资深后端同事,知道这里是服务端环境(Node.js),知道要遵守我既定的分层架构,而不是为了省事写一堆“一次性代码”。

这说明 M2.1 不再只是一个会写代码片段的大模型,它具备了资深工程师的素养,能在一个成熟的复杂项目里干活了,这点是真的赞。

不仅如此,目前很多大模型擅长写Python,但是遇到Typescript,Go,Java这样的后端语言,就容易出问题。

特别是像我这个Next.js项目,虽然是全栈框架,但后端逻辑极重(涉及视频合成、任务队列)。这一直是 AI 的“重灾区”:以往的模型一看到 Next.js,脑子里全是前端的useEffectdiv,经常试图用写 React 组件的方式去写后端 API 服务,导致各种window is not defined的报错。

经过我的实际项目开发,看出来MiniMax M2.1在跑含上百个代码文件这种复杂工程的项目,精准从大量后端API中找到对应的文件,添加对应的后端逻辑,这些都能应对自如,不错的。

总结一下

过去我们用 AI 写代码,往往止步于“能跑就行”,遇到复杂项目只能干瞪眼。

如今,通过MiniMax 它家的这个最新M2.1,看到了 AI 真正理解工程习惯的可能性。它不仅能搞定酷炫的前端页面,更能深入到复杂的后端逻辑中,帮我们维护已有的代码库。

最关键的是,它是国内模型,API 接入方便,再配合Claude Code这样的终端工具使用,体验丝滑。建议大家按照文中的思路,把那些因为太麻烦而没写的需求,丢给 M2.1 试一试。

以上全文 3969 字,27张图。若可以,给我个三连击:点赞、转发和在看。若可以再给我加个⭐️,谢谢你看我的文章,我们下篇再见。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 6:58:35

【限时揭秘】Open-AutoGLM manus未发布的10个隐藏功能,你知道几个?

第一章&#xff1a;Open-AutoGLM manus 技术架构全景解析Open-AutoGLM manus 是一个面向自动化自然语言理解与生成任务的开源架构&#xff0c;融合了图神经网络&#xff08;GNN&#xff09;、大语言模型&#xff08;LLM&#xff09;推理引擎与动态知识图谱构建能力。其核心设计…

作者头像 李华
网站建设 2026/3/30 21:43:33

5分钟掌握Mermaid图表编辑器:从新手到高手的完整指南

5分钟掌握Mermaid图表编辑器&#xff1a;从新手到高手的完整指南 【免费下载链接】mermaid-live-editor Location has moved to https://github.com/mermaid-js/mermaid-live-editor 项目地址: https://gitcode.com/gh_mirrors/mer/mermaid-live-editor 还在为制作专业图…

作者头像 李华
网站建设 2026/3/31 14:48:57

基于GPT-SoVITS构建虚拟主播语音系统的技术路径

基于GPT-SoVITS构建虚拟主播语音系统的技术路径 在直播与虚拟内容爆发式增长的今天&#xff0c;一个关键问题正摆在内容创作者面前&#xff1a;如何让虚拟主播真正“活”起来&#xff1f;不是靠预录语音循环播放&#xff0c;而是能实时回应弹幕、自然讲述故事、拥有独一无二的…

作者头像 李华
网站建设 2026/4/3 5:28:18

手把手教你部署Open-AutoGLM视频生成系统,10分钟快速上手不踩坑

第一章&#xff1a;Open-AutoGLM视频生成系统概述Open-AutoGLM 是一个基于生成式语言模型与扩散模型融合架构的开源视频生成系统&#xff0c;旨在实现从自然语言描述到高质量动态视频内容的端到端生成。该系统结合了文本理解、时序建模与多帧一致性优化技术&#xff0c;支持用户…

作者头像 李华
网站建设 2026/4/5 16:23:23

网页元素定位神器:5步教你轻松搞定页面元素查找难题

网页元素定位神器&#xff1a;5步教你轻松搞定页面元素查找难题 【免费下载链接】xpath-helper-plus 项目地址: https://gitcode.com/gh_mirrors/xp/xpath-helper-plus 还在为网页元素定位而苦恼吗&#xff1f;无论是前端开发、自动化测试还是数据采集&#xff0c;精准…

作者头像 李华