news 2026/6/4 6:40:03

Agnes AI 全家桶深度解析:文本、图像、视频,参数级使用指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agnes AI 全家桶深度解析:文本、图像、视频,参数级使用指南

文章目录

    • 背景
    • 先说结论
    • 一、文本模型:Agnes-2.0-Flash
      • 定位
      • 完整参数表
        • 基础请求参数
        • messages 消息格式
        • tools 工具定义格式
        • Thinking 模式参数
      • API 信息
      • 模型限制
      • 响应格式详解
      • 使用建议
    • 二、轻量文本模型:Agnes-1.5-Flash
      • 定位
      • 完整参数表
      • 多模态消息格式(文本+图像)
      • API 信息
      • 模型限制
      • 与 2.0-Flash 的关键区别
      • 使用建议
    • 三、图像模型:Agnes Image 2.1 Flash
      • 定位
      • 完整参数表
        • 文生图请求参数
        • extra_body 参数(图生图)
      • API 信息
      • Prompt 结构详解
      • 图生图 Prompt 结构
      • 高信息密度图像技巧
      • 使用建议
    • 四、图像模型:Agnes Image 2.0-Flash
      • 定位
      • 完整参数表
      • 关键参数说明
      • API 信息
      • 响应格式
      • 与 2.1-Flash 的选择建议
    • 五、视频模型:Agnes Video V2.0
      • 定位
      • 完整参数表
        • 创建视频任务参数
      • num_frames 约束(重要!)
      • 视频时长计算
      • 异步任务工作流
      • 任务状态说明
      • 错误码
      • Prompt 结构详解
      • 参数推荐配置
      • API 信息
    • 六、全模型参数速查对照
      • 公共参数
      • 各模型 Endpoint 汇总
      • 各模型价格汇总(现价均为免费)
    • 七、快速上手代码示例
      • Python 文本调用
      • Python 图像调用
      • Python 视频调用(异步)
    • 八、总结

背景

周一的时候看到了一篇公众号推文,

所以就趁着这个机会去试了下。

官网参考:agnes-ai


使用方式很简单,注册一个账号,然后获取api key,其余和前面介绍的LLM使用方式一致。

model方面的话,暂时就下面这么5个

我也一并按照前面介绍过的方式,在claude code以及copilot oai中接入了(可以参考我前面的博客)。

我试了一下几个任务,还是挺不错的,至少生成速度很快

目前作为我的备用方案,调整如下:

  • 2.0 flash:开thinking(在oai的advanced settings中设置),目前用于coding、agent任务,主力

  • 1.5 flash:没有thinking,但是多模态,作为简单的文本问答+图片简单解析,即问即答

  • 其余的model我暂时没有深度需求

配置方式下图是copilot中调用,还是参考我之前的博客:Vscode LLM备用方案


先说结论

Agnes AI 将旗下全部核心模型 API无限期免费开放。不是试水某个模型,而是文本、图像、视频三个模态一次性打包。本文按模型逐一拆解,重点讲清楚每个参数什么意思、怎么设、什么场景用什么值


一、文本模型:Agnes-2.0-Flash

定位

面向智能体工作流、工具调用、编程、推理的生产级语言模型。Claw-Eval 基准测试 General Leaderboard 排名第 9,Pass^3 分数 60.9%。

完整参数表

基础请求参数
参数类型必填说明推荐值
modelstring模型名称,固定为agnes-2.0-flashagnes-2.0-flash
messagesarray对话消息数组,每个元素含rolecontent
temperaturenumber控制输出随机性。0=完全确定,1=最大随机确定性任务 0.1-0.3,创意任务 0.7-0.9
top_pnumber核采样阈值。0.1=只考虑高概率token,1.0=不限制默认 1.0,需要稳定输出可设 0.9
max_tokensnumber响应最多生成的 token 数根据任务设定,一般 1024-4096
streamboolean是否启用流式输出。true=逐块返回,false=一次性返回实时交互场景用 true
toolsarray工具定义数组,用于 function calling见下方工具定义格式
tool_choicestring/object控制模型是否/如何使用工具。auto=自动选择,none=不调用,{"type":"function","function":{"name":"xxx"}}=强制调用某个工具auto为默认
messages 消息格式
{"role":"system"|"user"|"assistant","content":"消息内容"}
  • system:设定角色和行为准则,放在消息数组最前面
  • user:用户输入
  • assistant:模型回复,用于多轮对话上下文
tools 工具定义格式
{"type":"function","function":{"name":"get_weather","description":"获取某地点的当前天气","parameters":{"type":"object","properties":{"location":{"type":"string","description":"城市和国家"}},"required":["location"]}}}
Thinking 模式参数

针对编程、调试、推理、Agent 工作流,开启深度思考可显著提升质量。

OpenAI 兼容格式

{"model":"agnes-2.0-flash","messages":[...],"chat_template_kwargs":{"enable_thinking":true}}

Anthropic 兼容格式

{"model":"agnes-2.0-flash","messages":[...],"thinking":{"type":"enabled","budget_tokens":2048}}
参数说明建议
enable_thinking是否开启深度思考编程/推理任务设为true
type固定为"enabled"
budget_tokens最大思考 token 预算简单任务 2048,复杂调试/多步骤 Agent 任务可提高到 4096-8192

API 信息

Endpoint: https://apihub.agnes-ai.com/v1/chat/completions Method: POST Content-Type: application/json Auth: Authorization: Bearer YOUR_API_KEY

模型限制

项目数值
Context Window256K
Max Output65.5K

响应格式详解

{"id":"chatcmpl_xxx",// 本次请求唯一 ID,用于追踪"object":"chat.completion",// 对象类型"created":1774432125,// 请求时间戳(Unix 秒)"model":"agnes-2.0-flash",// 使用的模型"choices":[// 生成结果列表{"index":0,// 结果索引(多候选时有用)"message":{"role":"assistant",// 角色固定为 assistant"content":"模型生成的内容"},"finish_reason":"stop"// 停止原因:stop=正常结束,length=max_tokens 触发,tool_calls=触发了工具调用}],"usage":{"prompt_tokens":35,// 输入 token 数"completion_tokens":58,// 输出 token 数"total_tokens":93// 总计}}

使用建议

  • Prompt 结构[角色] + [任务] + [上下文] + [要求] + [输出格式]
  • temperature:代码生成/调试用 0.1-0.3,文案创作用 0.7-0.9
  • stream:需要实时反馈的场景(如聊天机器人)设为 true
  • Thinking:编程任务务必开启,budget_tokens 从 2048 起步

二、轻量文本模型:Agnes-1.5-Flash

定位

低延迟、高并发、低成本场景的轻量模型。支持文本+图像多模态输入。

完整参数表

参数类型必填说明推荐值
modelstring固定为agnes-1.5-flash
messagesarray对话消息数组
temperaturenumber采样温度,控制随机性0.5-0.8
top_pnumber核采样概率默认 1.0
max_tokensinteger最大生成 token 数根据任务设定
frequency_penaltynumber频率惩罚,减少重复内容。范围通常 -2.0~2.0,正值降低重复0.0-0.5
presence_penaltynumber存在惩罚,鼓励引入新话题。范围通常 -2.0~2.00.0-0.5
repetition_penaltynumber重复控制系数1.0-1.2
stopstring/array自定义停止序列。遇到这些字符串就停止生成
seedinteger随机种子,保证结果可复现固定值可复现

多模态消息格式(文本+图像)

{"role":"user","content":[{"type":"text","text":"描述这张图片"},{"type":"image_url","image_url":{"url":"https://example.com/image.jpg"}}]}
  • type: "text":纯文本内容
  • type: "image_url":图像 URL,模型会理解图像内容并与文本联合响应

API 信息

Endpoint: https://apihub.agnes-ai.com/v1/chat/completions Method: POST Auth: Bearer Token

模型限制

项目数值
Context Window256K
Max Output65.5K

与 2.0-Flash 的关键区别

维度1.5-Flash2.0-Flash
侧重速度、成本推理、Agent、编程
多模态输入✅ 文本+图像❌ 纯文本
Thinking 模式
工具调用
frequency/presence_penalty✅ 支持❌ 不支持
价格$ 0.07/ $0.15 per 1M tokens$ 0.1/ $0.2 per 1M tokens

使用建议

  • 图像理解:用content数组同时传入文本和图像 URL,模型会联合理解
  • 高并发场景:1.5-Flash 的量化技术降低了计算资源需求,适合批量处理
  • 需要复现结果:设置固定seed

三、图像模型:Agnes Image 2.1 Flash

定位

升级版图像生成模型,文生图 + 图生图,重点优化了高信息密度图像的生成质量。

完整参数表

文生图请求参数
参数类型必填说明推荐值
modelstring固定为agnes-image-2.1-flash
promptstring图像生成的文本指令,描述想要的内容越详细越好
sizestring输出图像尺寸1024x768
extra_bodyobject高级工作流的额外参数见下方
extra_body 参数(图生图)
参数类型必填说明
extra_body.imagearray图生图时✅输入图像 URL 数组,图生图任务的源图像
extra_body.response_formatstring响应格式,url=返回图像 URL

API 信息

Endpoint: https://apihub.agnes-ai.com/v1/images/generations Method: POST Auth: Bearer Token Price: $0/image(免费)

Prompt 结构详解

[主体] + [场景/环境] + [风格] + [光照] + [构图] + [质量要求]
组成部分说明示例
主体画面的核心对象A luminous floating city
场景/环境主体所处的环境above a misty canyon at sunrise
风格艺术风格cinematic realism
光照光线效果soft golden light
构图画面布局wide-angle composition
质量要求细节程度high visual density

图生图 Prompt 结构

[需要改变什么] + [需要保持什么不变]

示例:Transform the scene into a rain-soaked cyberpunk night with neon reflections while preserving the original composition and main subject layout.

高信息密度图像技巧

2.1-Flash 针对复杂场景做了专项优化。Prompt 中需要清晰描述:

  1. 主体:画面核心对象
  2. 背景:远景元素
  3. 环境:氛围、天气、时间
  4. 重要细节:关键视觉元素
  5. 次要细节:丰富画面层次
  6. 风格与光照:整体调性
  7. 构图限制:视角、比例

使用建议

  • 文生图:用详细 prompt,包含所有 6 个组成部分
  • 图生图:明确说明"改什么"和"保什么"
  • 高密度场景:逐层描述视觉元素,不要遗漏重要细节

四、图像模型:Agnes Image 2.0-Flash

定位

高性能图像编辑与生成模型,支持图生图 + 多图合成。Artificial Analysis Image Editing Leaderboard ELO 1,184(Top 20)。

完整参数表

参数类型必填说明推荐值
modelstring固定为agnes-image-2.0-flash
promptstring图像编辑/生成的文本提示词
sizestring输出图像尺寸1024x7681024x1024768x1024
seednumber随机种子,保证结果可复现固定值可复现
tagsarray任务类型标记["img2img"]表示图生图
extra_body.imagearray图生图时✅输入图像 URL 数组
extra_body.response_formatstring输出格式url

关键参数说明

  • tags: ["img2img"]:图生图任务必须添加此标记,否则模型会当作文生图处理
  • extra_body.image:可传单张或多张图像 URL。多图时会将多张图合成为一张新图像
  • seed:设置固定值可复现相同结果,适合需要迭代优化的场景

API 信息

Endpoint: https://apihub.agnes-ai.com/v1/images/generations Method: POST Auth: Bearer Token Price: $0/image(免费)

响应格式

{"created":1774432125,"data":[{"url":"https://..."}],"usage":{"generated_images":1}}

与 2.1-Flash 的选择建议

需求选哪个
从零生成复杂场景2.1-Flash(高信息密度优化)
编辑现有图像2.0-Flash(图生图专精)
多图合成2.0-Flash(支持多参考图)
需要 seed 复现2.0-Flash(支持 seed 参数)

五、视频模型:Agnes Video V2.0

定位

下一代电影级视频生成模型,支持文生视频、图生视频、多图视频、关键帧动画四种工作流。

完整参数表

创建视频任务参数
参数类型必填说明推荐值
modelstring固定为agnes-video-v2.0
promptstring视频内容的文本描述
imagestring/array输入图片 URL 或 URL 数组图生视频时必填
modestring生成模式ti2vid(文生视频)或keyframes(关键帧)
heightinteger视频高度768
widthinteger视频宽度1152
num_framesinteger视频总帧数见下方约束
num_inference_stepsinteger推理步数默认值即可
seedinteger随机种子,保证可复现固定值可复现
frame_ratenumber视频 FPS1-60,推荐 24
negative_promptstring负向提示词,描述要避免的内容
extra_body.imagearray多图/关键帧时✅多图或关键帧的输入图片 URL
extra_body.modestring关键帧时✅额外模式设置"keyframes"

num_frames 约束(重要!)

num_frames 必须满足两个条件: 1. num_frames ≤ 441 2. num_frames = 8n + 1(n 为正整数) 合法值:81, 121, 161, 201, 241, 281, 321, 361, 401, 441 非法值:100, 150, 200, 300 等

视频时长计算

seconds = num_frames / frame_rate
目标时长num_framesframe_rate实际时长
约 3 秒81243.375s
约 5 秒121245.042s
约 6 秒161246.708s
约 10 秒2412410.042s
约 18 秒4412418.375s

调整策略

  • 想要更长的视频 → 降低frame_rate(如 12fps)
  • 想要更流畅的画面 → 提高frame_rate(如 30fps),但时长会变短

异步任务工作流

视频生成是异步的,分两步:

Step 1:创建任务

POST https://apihub.agnes-ai.com/v1/videos

返回:

{"id":"task_xxx","task_id":"task_xxx","object":"video","model":"agnes-video-v2.0","status":"queued",// 任务状态"progress":0,// 进度 0-100"created_at":1780457477,// 创建时间戳"seconds":"10.0",// 预计时长"size":"1280x768"// 分辨率}

Step 2:轮询结果

GET https://apihub.agnes-ai.com/v1/videos/{task_id}

返回(完成时):

{"id":"task_xxx","model":"agnes-video-v2.0","object":"video","status":"completed",// 任务状态"progress":100,"seconds":"10.0","size":"1280x768","error":null,"remixed_from_video_id":"https://storage.../video_xxxxxx.mp4"// 视频 URL}

任务状态说明

状态说明下一步
queued排队等待中继续轮询
in_progress正在生成中继续轮询
completed生成完成remixed_from_video_id获取视频
failed生成失败检查error字段,调整参数重试

错误码

错误码说明处理
400请求参数无效检查参数格式和约束
401未授权检查 API Key
404任务不存在检查 task_id
500服务器错误稍后重试
503服务繁忙稍后重试

Prompt 结构详解

文生视频[主体] + [动作] + [场景] + [镜头运动] + [光照] + [风格]

图生视频:描述哪些内容需要运动,同时保持关键主体稳定

多图视频:描述输入图片之间的关系和过渡方式

关键帧动画:清晰描述帧与帧之间的过渡关系

参数推荐配置

场景widthheightnum_framesframe_rate
标准视频115276812124
短视频(社交)115276881 或 12124
更流畅运动115276812130
可复现结果设置固定 seed
关键帧过渡extra_body.mode: “keyframes”

API 信息

创建任务: POST https://apihub.agnes-ai.com/v1/videos 查询结果: GET https://apihub.agnes-ai.com/v1/videos/{task_id} Auth: Bearer Token Price: $0/second(免费)

六、全模型参数速查对照

公共参数

参数2.0-Flash1.5-FlashImage 2.1Image 2.0Video V2.0
model
messages
prompt
temperature
top_p
max_tokens
seed
stream
size
imageextra_bodyextra_body✅ / extra_body
tools
thinking
num_frames
frame_rate
negative_prompt

各模型 Endpoint 汇总

模型Endpoint
文本(2.0/1.5)POST /v1/chat/completions
图像(2.1/2.0)POST /v1/images/generations
视频 V2.0POST /v1/videosGET /v1/videos/{task_id}

各模型价格汇总(现价均为免费)

模型输入价格输出价格其他
2.0-Flash$ 0.1/1M → $0$ 0.2/1M → $0
1.5-Flash$ 0.07/1M → $0$ 0.15/1M → $0
Image 2.1$ 0.003/image → $0
Image 2.0$ 0.003/image → $0
Video V2.0$ 0.005/second → $0

七、快速上手代码示例

Python 文本调用

importhttpx response=httpx.post("https://apihub.agnes-ai.com/v1/chat/completions",headers={"Authorization":"Bearer YOUR_API_KEY"},json={"model":"agnes-2.0-flash","messages":[{"role":"user","content":"Hello"}],"temperature":0.7,"max_tokens":1024,"stream":False,})print(response.json()["choices"][0]["message"]["content"])

Python 图像调用

response=httpx.post("https://apihub.agnes-ai.com/v1/images/generations",headers={"Authorization":"Bearer YOUR_API_KEY"},json={"model":"agnes-image-2.1-flash","prompt":"A floating city above a misty canyon at sunrise","size":"1024x768",})print(response.json()["data"][0]["url"])

Python 视频调用(异步)

# Step 1: 创建任务create_resp=httpx.post("https://apihub.agnes-ai.com/v1/videos",headers={"Authorization":"Bearer YOUR_API_KEY"},json={"model":"agnes-video-v2.0","prompt":"A cinematic shot of a cat walking on the beach at sunset","height":768,"width":1152,"num_frames":121,"frame_rate":24,})task_id=create_resp.json()["task_id"]# Step 2: 轮询结果importtimewhileTrue:result=httpx.get(f"https://apihub.agnes-ai.com/v1/videos/{task_id}",headers={"Authorization":"Bearer YOUR_API_KEY"})data=result.json()ifdata["status"]=="completed":print(data["remixed_from_video_id"])breakelifdata["status"]=="failed":print("Failed:",data.get("error"))breaktime.sleep(5)# 每 5 秒轮询一次

八、总结

模型核心优势关键参数适合谁
2.0-FlashAgent、编程、推理tools, thinking, stream开发者、AI 工程师
1.5-Flash低延迟、多模态输入frequency_penalty, seed高并发、图像理解
Image 2.1高信息密度文生图prompt, size设计师、内容创作者
Image 2.0图像编辑、多图合成tags, seed, image视觉设计师、电商
Video V2.0电影级视频、运镜控制num_frames, frame_rate, mode视频创作者、广告

一句话:一个 API Key,五种模型,文本→图像→视频全链路打通,全部免费。参数虽多,但按场景选对组合,几分钟就能跑通第一个 Demo。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/4 6:39:40

亦唐科技数字化转型引领中国智能制造的新潮流

随着信息技术的不断发展,数字化转型已成为全球制造业发展的一大趋势。亦唐科技(YIKTONG)作为中国智能制造领域的佼佼者,凭借领先的数字化技术,逐步引领国内制造业迈向更智能、更高效、更绿色的新时代。本文将探讨亦唐科…

作者头像 李华
网站建设 2026/6/4 6:39:08

STM32F103C8T6 USB虚拟串口踩坑实录:从驱动安装失败到高速数据传输调试

STM32F103C8T6 USB虚拟串口开发实战:从驱动异常到高速传输优化第一次在STM32F103C8T6上实现USB虚拟串口功能时,设备管理器里那个黄色感叹号让我记忆犹新。作为嵌入式开发者,我们都经历过这种时刻——按照教程一步步操作,结果连最基…

作者头像 李华
网站建设 2026/6/4 6:37:57

GPT-5不存在?2024年大模型真实能力与实用路径

我不能按照该标题生成相关内容,因为:“GPT-5”目前并不存在。截至2024年7月,OpenAI官方未发布、未命名、未确认任何代号为“GPT-5”的模型。其最新公开发布的旗舰模型为GPT-4o(2024年5月发布),此前为GPT-4 …

作者头像 李华
网站建设 2026/6/4 6:37:57

Alice-Tools:5个步骤解锁AliceSoft游戏资源的终极指南

Alice-Tools:5个步骤解锁AliceSoft游戏资源的终极指南 【免费下载链接】alice-tools Tools for extracting/editing files from AliceSoft games. 项目地址: https://gitcode.com/gh_mirrors/al/alice-tools 你是否曾经面对AliceSoft游戏的神秘二进制文件感到…

作者头像 李华
网站建设 2026/6/4 6:36:54

mac 安装 Milvus 向量数据库

一、环境准备 1.1 前置条件 Docker Desktop(已安装并运行) Python 3.x(用于 pymilvus 客户端) 验证 Docker 正在运行: docker info二、安装 Milvus Standalone 2.1 创建工作目录并下载官方 docker-compose 配置 mkdir -p ~/milvus-standalone cd ~/milvus-standalonec…

作者头像 李华