一、面试题目
请讲解 AI Agent Skill 层面如何实现参数校验、依赖注入、权限控制、超时控制、重试机制、幂等性,分别说明实现方式、落地规则与技术方案。
二、知识储备
1. 参数校验(入参/出参校验)
目标:提前拦截非法参数、空值、格式错误、越界数据,避免下游工具调用报错、产生幻觉、资损。
校验内容
- 非空校验:用户ID、订单ID、手机号、关键业务参数必填
- 格式校验:手机号、订单号、时间格式、枚举值
- 范围校验:退款金额、赔付额度、时间范围、状态合法性
- 业务规则校验:订单是否可退款、是否超售后时效
实现方式
- 配置化校验:JSON Schema / YAML 定义参数规则
- 代码层校验:Skill 入口统一校验器
- 强约束:校验失败直接拒绝执行,返回明确错误,不进入工具调用
要点
在Skill入口统一拦截,不在内部各个步骤重复校验。
2. 依赖注入(DI)
目标:解耦 Skill 与底层 Tool、数据库、缓存、外部接口,实现可插拔、可测试、可替换。
注入对象
- 工具依赖:查询订单、物流、退款、RAG 检索工具
- 基础设施:Redis、向量库、消息队列、配置中心
- 通用组件:日志、鉴权、熔断、重试、监控
实现方式
- 构造函数注入:Skill 初始化时注入依赖
- 上下文注入:执行时通过上下文透传
- 容器托管:Skill 中台统一管理依赖实例
优势
Skill 只关注业务流程,不用关心底层调用细节;便于单元测试、Mock 测试。
3. 权限控制
目标:多租户、多角色、数据隔离,防止越权访问、越权操作(如查别人订单、随意退款)。
三层权限
- 租户级:只能操作本租户数据,tenant_id 强制过滤
- 用户级:只能操作自己的订单/数据,user_id 绑定
- 功能级:普通用户不能执行赔付、后台操作等高危 Skill
实现
- 执行前鉴权:从上下文获取用户身份、角色、租户ID
- 数据过滤:所有查询自动带上租户+用户过滤条件
- 高危操作二次校验:大额退款、赔付需权限放行
要点
权限前置校验,贯穿 Skill 全流程,工具调用前必校验。
4. 超时控制
目标:防止下游接口慢、网络抖动导致 Skill 卡死、线程堆积、雪崩。
实现
- 全局超时:整个 Skill 执行总超时(如 5s)
- 单工具超时:每个 Tool 调用独立超时(如 2s)
- 超时策略:超时直接熔断,返回兜底结果或人工转接
落地规则
- 实时数据类(订单/物流)严格短超时
- 复杂推理类适当放宽
- 超时后不再重试,直接降级
5. 重试机制
目标:应对瞬时网络波动、接口抖动,提高执行成功率;禁止业务异常重试。
重试规则(面试必背)
- 可重试:网络异常、连接超时、5xx 服务端错误
- 不可重试:参数错误、权限不足、业务规则不允许、4xx 错误
实现
- 指数退避重试:1s→2s→4s,最多 2–3 次
- 按工具粒度重试,不整段 Skill 重试
- 重试次数超限直接熔断降级
禁忌
退款、赔付类高危操作禁止重试,防止重复扣款。
6. 幂等性(最关键,防资损)
目标:保证同一请求多次触发,只执行一次,防止重复退款、重复赔付、重复创建工单。
实现方案
- 唯一幂等ID:每个 Skill 调用生成 requestId,全局唯一
- 幂等表/Redis:记录 requestId + 执行状态(待执行/成功/失败)
- 执行前查状态:已成功直接返回结果;执行中加分布式锁
- 结果可回溯:通过订单ID+用户ID做业务幂等
高危场景强制幂等
退款、赔付、红包发放、订单创建,必须幂等兜底。
三、代码实现(Skill 统一执行骨架)
class BaseSkill: def __init__(self, tools, auth_service, idempotent_helper): # 依赖注入 self.tools = tools self.auth = auth_service self.idempotent = idempotent_helper async def run(self, context): # 1. 参数校验 self.validate_params(context.params) # 2. 权限校验 self.auth.check_permission(context.user_id, context.tenant_id) # 3. 幂等校验 idempotent_key = f"{context.skill_id}:{context.request_id}" if self.idempotent.is_done(idempotent_key): return self.idempotent.get_result(idempotent_key) try: # 4. 带超时、重试执行业务流程 result = await self.execute_with_timeout_retry(context) self.idempotent.mark_success(idempotent_key, result) return result except Exception as e: self.idempotent.mark_fail(idempotent_key) return self.fallback()四、破局之道(面试升华)
Skill 相比传统 Function Calling,核心优势就是标准化的非功能能力封装。
通过参数校验提前拦截非法输入、依赖注入解耦工具、权限控制保障安全、超时防止卡死、重试提升稳定性、幂等杜绝资损,把原本模型容易出错、不可控的单步调用,升级为稳定、安全、可运维、可规模化的企业级业务能力,这也是生产环境落地的核心要求。