news 2026/5/9 5:54:44

AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

想象一下,你现在是一家大型电商平台的AI架构师。双十一期间,你的智能客服系统每天要处理千万级的用户咨询。每个问题都要调用昂贵的GPT-API,响应慢、成本高,用户投诉飙升……这时候,你会怎么做?"

"我们会发现一个奇怪的现象——每天有30%的问题是完全相同的!用户都在问:'快递几天能到?'、'怎么退货?'、'商品有保修吗?'……每个问题都要调用GPT-4,每次花费0.03美元,一天就是数万美元!更糟的是,相同的回答,用户要等3-5秒才能看到……"

解决方案:引入缓存机制(如下使用sqlite当缓存数据库),当用户问道相同问题时,从缓存里直接给出答案不用将问题在送给大模型,既节约金钱成本也节约时间成本。

直接看代码:

from langchain_community.cache import SQLiteCache from langchain.globals import set_llm_cache from langchain_openai import ChatOpenAI import os #指定缓存 对比提问同样的问题,返回时间 set_llm_cache(SQLiteCache(database_path="langchain_demo.db")) llm = ChatOpenAI( api_key=os.getenv("DEEPSEEK_API_KEY"), base_url=os.getenv("DEEP_URL"), # Deepseek 的 API 基础地址 model="deepseek-v3:671b", # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型) temperature=0.7, # 温度参数(0-1,越低越稳定) max_tokens=1024 # 最大生成 tokens ) #这时会向数据库里插入一条数据 response =llm.invoke("hello world") print(response.content) #再插入一条数据 注:是否插入要根据提示词和调用的模型(模型参数改变也会认为是不同) response =llm.invoke("how are you") print(response.content) #这时就会从缓存里直接出结果不会送往大模型,数据库里也不会新插入一条数据 response =llm.invoke("hello world") print(response.content)

运行结果:可以看到 第一次的回答和第三次的回答是完全一样的。

Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊 Hey there! Thanks for asking! I'm functioning at full capacity and ready to help you out. While I don't experience feelings in the way humans do, I genuinely enjoy our conversations and am always excited to learn and assist. How can I support you today? I'm all ears! 🌟 Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊

我们可以看到,虽然我么提问了三次问题,但是缓存数据库里只有两条数据,说明第三次提问,回答是从缓存里走的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 7:01:55

社交化二手交易平台源码,集成圈子社交,提升用户粘性与交易效率

温馨提示:文末有资源获取方式 在当今互联网生态中,社交与电商的融合已成为趋势。作为网站小编,我特别推荐一款集成了社交功能的二手交易小程序源码系统,它不仅支持基础的买卖交易,还通过丰富的社交互动增强用户体验。源…

作者头像 李华
网站建设 2026/5/9 7:01:46

从九尾狐AI培训看企业AI获客系统的架构设计与落地实践

第一章:企业AI培训的技术底层逻辑 现代企业AI培训系统本质上是"知识传递工具赋能数据反馈"的三位一体架构。九尾狐AI的企业AI培训体系之所以能实现"快上手、易执行、现场就落地",源于其独特的模块化设计: class Enterpr…

作者头像 李华
网站建设 2026/5/3 10:06:22

2026年美赛F题——翻译及建模思路

F题:拥抱生成式 AI,抑或拒绝?短短数年间,生成式人工智能(生成式 AI)已从一款功能有限、仅为少数早期使用者所用的工具,发展为深度融入日常生活、功能强大且无处不在的资源。相关研究表明&#x…

作者头像 李华
网站建设 2026/5/8 15:44:25

好写作AI:环境科学跨尺度数据论文的AI综合写作模式

从分子到全球:环境科学论文的数据整合之困 在环境科学研究中,一个核心挑战是如何将不同时空尺度、不同类型的数据整合为一套逻辑自洽、有说服力的学术论证。从实验室的微观污染物检测,到河流流域的中观生态评估,再到全球气候模型…

作者头像 李华
网站建设 2026/5/5 12:12:13

(7-3-02)电机与执行器系统:驱动器开发与控制接口(2)实时通信总线设计+33自由度人形机器人的双信道EtherCAT主设备架构

7.3.3 实时通信总线设计实时通信总线是人形机器人“中央控制器-多关节执行器”的核心数据传输链路,其核心功能是实现控制指令的高速下发与执行器状态数据的实时上传,保障多关节协同运动的同步性与精准性。针对人形机器人20~30个关节的分布式控制需求&am…

作者头像 李华
网站建设 2026/5/2 15:25:22

【概念板块和行业板块】

这是一个关于股票市场概念板块和行业板块的核心区别与联系的详细解释。 核心区别一句话概括: 行业板块:按公司主营业务是什么来划分,是“现在做什么”。 概念板块:按公司涉及什么热门题材、主题或技术来划分,是“未…

作者头像 李华