在 AI 内容创作工具层出不穷的今天,很多创作者都面临着 "工具碎片化" 的困境:生图用一个软件,写作用另一个,做视频又要切换到第三个平台,不仅账号和配置无法统一,数据也难以互通。
我们基于智谱 AI 全系列 API,打造了这款集成式 AI 工具箱,将文生图、图生图、反推提示词、文生视频、图生视频、批量写作六大核心功能整合在一个轻量化界面中,让创作者无需在多个工具间反复跳转,一站式完成所有内容创作任务。
🎨 文生图:可视化操作,零基础也能出大片
非技术用户接触 AI 生图时,最先卡在 "入门门槛"—— 手动配置 API、编写调用代码,光是环境搭建就劝退大半人。我们的核心开发思路是 "把复杂逻辑藏在底层,把简单交互留给用户",基于 tkinter 搭建了完整的可视化交互框架,让所有操作都能通过图形界面完成,彻底摆脱命令行依赖。
def __init__(self, root): self.root = root self.base_title = "步里软件【编号2604】智谱AI工具箱_v1.3.2" self.root.title(self.base_title) self.root.geometry("500x620") self.root.resizable(True, True) self.config = configparser.ConfigParser()这段代码是可视化界面的基础框架,我们预设了合理的窗口尺寸且支持自由调整,同时集成配置文件解析模块。用户可自由选择 GLM-Image、CogView-4、CogView-3-Flash 等主流生图模型,调整 1:1、16:9、9:16 等十余种图片比例,支持自定义尺寸和单次生图数量。工具还内置了固定提示词后缀功能,用户只需输入核心主题,工具会自动添加风格、画质等通用描述,大幅提升生图效率。
🖼️ 图生图:一键批量重绘,灵感无限延伸
很多设计师和创作者都有这样的困扰:找到一张不错的参考图,但想调整风格、尺寸或细节时,却要重新写提示词从头生成。我们的图生图功能完美解决了这个痛点,支持批量导入图片,自动反推提示词并生成风格相似的新图片。
def _img2img_generation_thread(self, image_files, output_folder): for file_index, input_file in enumerate(image_files): with open(input_file, "rb") as img_file: img_base = base64.b64encode(img_file.read()).decode("utf-8") response = client.chat.completions.create( model="glm-4.6v-flash", messages=[{"role": "user", "content": [{"type": "image_url", "image_url": {"url": img_base}}]}] )工具会先调用 GLM-4V 多模态模型分析输入图片,自动提取风格、构图、色彩、主体等关键信息生成详细提示词,再使用用户指定的生图模型生成新图片。支持添加文件和添加文件夹两种导入方式,可批量处理上百张图片,生成的图片会自动按原文件名分类保存,完美解决了 "批量重绘效率低"" 提示词描述不准确 " 的痛点。
🔍 反推提示词:精准还原图片创作思路
看到一张好图却不知道怎么用 AI 复刻,是很多 AI 创作者的共同难题。我们的反推提示词功能基于智谱最新的多模态大模型,能精准分析图片的每一个细节,生成专业、详细的提示词,让你轻松复刻任何风格的图片。
def _reverse_prompt_thread(self, input_folder, output_folder): for i, image_path in enumerate(image_files): with open(image_path, "rb") as img_file: img_base = base64.b64encode(img_file.read()).decode("utf-8") response = client.chat.completions.create( model=self.reverse_model_var.get(), messages=[{"role": "user", "content": [{"type": "image_url", "image_url": {"url": img_base}}]}] )工具支持批量导入整个文件夹的图片,自动遍历所有图片并生成对应的提示词,结果会保存为 TXT 文件,每行对应一张图片。用户还可以自定义反推指令,比如要求重点描述风格、构图或色彩,生成的提示词可直接复制到文生图功能中使用,解决了 "提示词写不好"" 无法复刻优秀作品 " 的痛点。
🎬 文生视频:文字转视频,一键生成动态内容
AI 视频生成是当下最热门的创作方向,但大多数视频生成工具都需要复杂的参数设置,且生成速度慢、成功率低。我们的文生视频功能集成了智谱最新的 CogVideoX 系列模型,支持 cogvideox-2、cogvideox-3、cogvideox-flash 等多个版本,让文字转视频变得简单高效。
def _create_video_task(self, prompt): url = "https://open.bigmodel.cn/api/paas/v4/videos/generations" payload = { "model": self.video_model_var.get(), "prompt": prompt[:512], "quality": self.video_quality_var.get(), "with_audio": self.video_with_audio_var.get(), "size": self.video_size_var.get() } response = requests.post(url, headers=headers, json=payload)用户只需输入一行提示词,选择视频尺寸、帧率和输出模式,工具会自动创建视频生成任务并实时监测进度。支持生成 720p 到 4K 分辨率的视频,可选择 "速度优先" 或 "质量优先" 模式,还能一键生成 AI 音效。工具会自动下载生成的视频并保存到指定文件夹,解决了 "视频生成操作复杂"" 需要手动等待和下载 " 的痛点。
🎞️ 图生视频:静态图片变动态,让画面活起来
只有一张静态图片,想让它变成动态视频?我们的图生视频功能完美满足这个需求,支持将任意静态图片转换为流畅的动态视频,还能通过提示词控制画面的运动方向和幅度。
def _create_img2video_task(self, img_base, prompt): payload = { "model": self.img2video_model_var.get(), "image_url": img_base, "prompt": prompt[:512], "duration": self.img2video_duration_var.get(), "movement_amplitude": self.img2video_movement_amplitude_var.get() }工具支持批量导入图片,可设置视频时长、运动幅度和尺寸,生成的视频会保留原图的风格和主体,同时添加自然的动态效果。比如让风景图中的云朵飘动、水面荡漾,让人物图片中的头发和衣服随风摆动。支持 viduq1、vidu2 等最新的图生视频模型,生成效果更加自然流畅,解决了 "静态图片表现力不足"" 手动制作视频成本高 " 的痛点。
✍️ 批量写作:一键生成多篇文章,解放创作双手
自媒体创作者、文案工作者经常需要批量生成文章,手动一篇篇写不仅效率低,还容易思路枯竭。我们的批量写作功能基于智谱 GLM-4 系列大模型,支持批量导入主题,一键生成多篇高质量文章。
def _batch_writing_thread(self, fixed_prompt, topics, output_folder): for i, topic in enumerate(topics): full_prompt = f"{fixed_prompt}\n\n主题: {topic}" response = client.chat.completions.create( model=self.batch_writing_model_var.get(), messages=[{"role": "user", "content": full_prompt}], max_tokens=self.batch_writing_max_tokens_var.get() )用户可以设置统一的固定提示词,定义文章的风格、结构和字数要求,然后批量导入多个主题。工具会自动为每个主题生成一篇独立的文章,并保存为 TXT 文件,文件名自动使用主题名称。支持 GLM-4.7-flash、GLM-5 等最新模型,还能开启 "深度思考" 功能,让文章内容更加深入、有逻辑,解决了 "批量写作效率低"" 文章质量参差不齐 " 的痛点。
⚙️ 底层架构设计:模块化开发,稳定高效
除了丰富的功能,我们在底层代码结构上采用了模块化设计,将界面交互、API 调用、文件管理、任务处理拆分为独立模块,每个功能都作为独立方法封装在 ZhipuImageGenerator 类中。这种设计既降低了代码耦合度,保障了程序的稳定性,也让功能扩展更灵活。
工具还内置了完善的错误处理和重试机制,当遇到 API 限流或网络波动时,会自动切换到下一个 API 密钥并等待重试,避免任务中断。所有配置都会自动保存到 config.ini 文件,下次启动时自动加载,无需重复设置。同时,工具会实时记录操作日志,方便用户排查问题和追溯生成记录。
这款智谱 AI 工具箱的开发,始终以 "解决用户实际痛点" 为核心,将六大核心功能整合在一个轻量化的界面中,让创作者无需在多个工具间反复跳转。无论是自媒体创作者批量生产内容,设计师寻找创意灵感,还是普通用户体验 AI 创作的乐趣,都能通过这款工具轻松实现需求。技术的价值不在于复杂,而在于让更多人能便捷地使用,这也是我们在代码开发与功能设计中始终坚守的原则。
⚙️ 程序源码及成品软件下载:
https://pan.quark.cn/s/903b80fd0e11
https://pan.baidu.com/s/5DktH3g2D6y4l8PRmY1beWQ
智谱 AI 工具箱,文生图工具,图生图批量重绘,AI 反推提示词,文生视频软件,图生视频工具,AI 批量写作,智谱 API 调用,GLM-4 多模态,CogVideoX 视频生成,AI 内容创作工具,一站式 AI 生成平台