最近看了一些相关的agent设计的书籍。个人认为agent的设计还是分为基础的几类:
1、拆解 执行 决策(单agent)
2、多agent协作 发布任务、领取任务并执行(单agent)
其中第二个的好处是并发思考
目前很多已经开源的项目更多的是帮agent设计更加的关注具体的业务。
还是存在比较多的误区或者混淆就是到底是要做一个针对于有限的业务场景还是做一个类似于openclaw和爱马仕一样的终端助手。
感觉后面更多还是终端助手这样的方式可能更便于使用以及不懂代码的人来操作。
对于一些有限场景的情况下还是作为简单的 拆解 执行 决策的方案可能更好一些,这样的话就只需要关注于模型的技能热插拔。
更希望更多的skills可以用比如说微服务的形式来限制和约束ai的具体能力。以及执行的稳定性。