Ollama+ChatGLM3-6B-128K打造专属AI助理：代码解释器与函数调用实操-平芜编程栈

Ollama+ChatGLM3-6B-128K打造专属AI助理：代码解释器与函数调用实操

想不想拥有一个能帮你写代码、分析数据、甚至自动调用外部工具的私人AI助理？今天，我们就来手把手教你，如何用Ollama部署强大的ChatGLM3-6B-128K模型，并解锁它最核心的“超能力”——代码解释器和函数调用。

很多朋友用过ChatGLM，觉得对话很流畅，但可能不知道，最新一代的ChatGLM3-6B-128K已经进化成了一个“多面手”。它不仅能聊天，更能理解你的指令，在对话中直接运行Python代码分析数据，或者像调用API一样，帮你查询天气、发送邮件。这背后靠的就是“代码解释器”和“函数调用”两大功能。

这篇文章，我会带你从零开始，在Ollama上部署这个长文本模型，并通过几个接地气的例子，让你亲眼看看它是如何把自然语言指令变成可执行动作的。无论你是开发者、数据分析师，还是单纯想提升效率的科技爱好者，这套组合都能让你事半功倍。

1. 环境准备与模型部署

万事开头难，但用Ollama部署模型，这个头开得特别简单。你不需要复杂的命令行，也不需要配置繁琐的环境。

1.1 快速找到并进入Ollama

首先，你需要找到Ollama的模型管理界面。通常在你使用的AI平台或工具中，会有一个明显的入口。如下图所示，点击类似“Ollama模型”或“模型市场”的按钮即可进入。

进入后，你会看到一个模型列表。我们的目标模型是EntropyYue/chatglm3，这是社区维护的ChatGLM3系列模型。

1.2 选择正确的模型版本

在页面顶部，找到模型选择下拉框。点击它，然后在列表中找到并选择EntropyYue/chatglm3。

这里有个关键点：EntropyYue/chatglm3这个仓库里包含了多个标签（Tag），比如chatglm3-6b和chatglm3-6b-128k。Ollama可能会自动拉取最新的或默认的标签。为了确保我们用到的是支持128K长上下文的版本，最好在拉取时指定标签。不过，在大多数通过Web界面直接选择的情况下，系统会帮你处理好。如果后续对话中你发现模型处理长文本的能力不如预期，可以尝试在Ollama的命令行中显式拉取：ollama pull entropyyue/chatglm3:chatglm3-6b-128k。

1.3 开始你的第一次对话

模型选择成功后，页面下方会出现一个熟悉的聊天输入框。现在，你就可以像和朋友聊天一样向它提问了。

试着输入“你好，请介绍一下你自己”，看看它的回应。如果一切正常，恭喜你，专属的ChatGLM3助理已经上线了！接下来，我们就要试试它的真本事。

2. 核心能力初探：代码解释器

代码解释器（Code Interpreter）是ChatGLM3-6B-128K的一个杀手级功能。简单说，就是你能在对话中直接要求它编写并运行一段代码（主要是Python），然后它会把代码执行的结果告诉你。这就像在你的聊天窗口里内置了一个Jupyter Notebook。

2.1 一个简单的数据分析例子

假设你手头有一组销售数据，想快速看看趋势。你可以直接对它说人话。

你的提问： “我这里有过去7天的每日销售额，数据是：[120, 150, 130, 170, 160, 200, 180]。帮我计算一下这周的平均销售额、最高和最低销售额，并用matplotlib画一个简单的折线图看看趋势。”

看看模型会怎么做：

理解需求：它会识别出你需要统计计算和绘图。
生成代码：在后台，模型会生成一段完整的、可执行的Python代码。
执行并返回：代码在一个安全的沙箱环境中运行，然后将计算结果和生成的图表（通常是图片链接或base64编码的图片）返回给你。

你得到的回复可能会包含类似这样的内容：

根据您的数据，分析结果如下： - 平均销售额：158.57 - 最高销售额：200 (第6天) - 最低销售额：120 (第1天) 已生成趋势折线图，如下所示： ![销售额趋势图](sandbox:/mnt/data/chart.png)

(注：实际图片会以可查看的形式嵌入)

整个过程，你不需要写任何代码，也不需要打开任何数据分析软件。你只需要描述清楚你想要什么。

2.2 代码解释器能做什么？

数据清洗与转换： “我有一串脏数据‘A, B, C, D, A, B’，请帮我统计每个字母出现的频率。”
数学计算与公式求解： “解这个方程：x^2 + 5x + 6 = 0。”
文本处理： “把这篇文章（粘贴文章）的关键词提取出来，并统计词频。”
基础可视化：就像上面的例子，生成柱状图、饼图、散点图等。
文件操作模拟： “假设我有一个CSV文件，内容如下…，请读取它并计算某一列的总和。”

它的强大之处在于，将思考和执行的过程自动化了。你负责提出问题和判断结果，它负责中间所有的代码实现。

3. 进阶技能解锁：函数调用

如果说代码解释器是让模型“自己动手”，那么函数调用（Function Call）就是让模型学会“指挥别人干活”。你可以预先定义好一些工具函数（比如查询数据库、调用天气API、发送邮件），然后告诉模型这些函数的存在和用法。当你的对话涉及这些功能时，模型会主动提出要调用哪个函数，并生成正确的调用参数。

3.1 理解函数调用的流程

这个过程有点像给助理一本《工具使用手册》：

你定义工具：告诉模型，“我这里有几个工具：get_weather(city_name)可以查天气，send_email(to, subject, body)可以发邮件。”
你提出需求：你对模型说，“帮我看看北京明天天气怎么样，然后发封邮件提醒我带伞。”
模型思考与提议：模型会理解你的需求，然后回复说：“我需要调用get_weather函数查询北京天气，然后根据结果调用send_email函数。请提供调用get_weather(‘北京’)所需的权限或确认。”
你（或系统）执行：你或者你背后的系统，收到这个清晰的指令后，去真正执行这个函数调用（比如调用真实的天气API），然后把执行结果（{“city”: “北京”， “weather”: “小雨”， “temp”: “15-20°C”}）返回给模型。
模型整合回复：模型拿到天气结果后，会组织语言告诉你：“北京明天小雨，气温15到20度。” 同时，它可能还会继续生成调用send_email函数的请求，让你确认发送。

3.2 一个实战案例：智能待办助手

我们来模拟一个场景。你定义了两个函数：

add_todo(item, priority)：向待办列表添加项目。
get_todos(status)：获取待办列表，可按状态（全部/未完成/已完成）筛选。

然后，你可以进行如下对话：

你：“我接下来要写一篇技术博客，买咖啡，然后复习一下函数调用的笔记。帮我把这些加到待办列表里，优先级都是中等。”

模型：（理解后，它知道需要调用三次add_todo函数）

我将帮您添加这三个待办事项。需要调用工具函数。 工具调用请求： { “function”: “add_todo”, “arguments”: {“item”: “写一篇技术博客”， “priority”: “medium”} }

(在实际Ollama Web界面中，这可能表现为一个可点击的“执行工具调用”按钮或一段结构化信息)

你（或系统）：点击确认或自动执行，并将成功结果{“success”: true, “id”: 101}返回给模型。

模型会继续生成第二个、第三个调用请求，直到全部添加完成。最后它会总结：“已成功添加三项待办事项：‘写技术博客’、‘买咖啡’、‘复习笔记’。”

你：“好的，现在给我看看所有未完成的待办事项。”

模型：

需要调用工具来获取列表。 工具调用请求： { “function”: “get_todos”， “arguments”: {“status”: “pending”} }

执行后，模型会拿到列表数据，并清晰地呈现给你。

通过这个例子，你可以看到，函数调用让ChatGLM3从一个聊天机器人，变成了一个可以操作真实系统、管理真实数据的智能中枢。你只需要用自然语言下达命令，它来负责翻译成精确的机器指令。

4. 为什么选择ChatGLM3-6B-128K？

在体验了以上功能后，你可能会问，为什么偏偏是ChatGLM3-6B-128K这个版本？它和之前的版本有什么不同？

4.1 核心优势：长达128K的上下文

这是它名字里“128K”的由来，也是最大的亮点。上下文长度决定了模型能记住并处理多长的对话历史和输入信息。

8K以内：如果你和模型的对话、你提供的文档材料加起来，长度通常在8000个token（约6000汉字）以内，那么标准的ChatGLM3-6B就完全够用，效率可能还更高。
超过8K，直至128K：当你需要处理非常长的文档（比如一篇长论文、一份几十页的报告）、进行超长对话（比如让AI持续分析一本小说），或者一次性输入大量数据时，ChatGLM3-6B-128K的优势就体现出来了。它能保持对全文信息的理解，不会“忘记”前面说过的重要内容。

举个例子：你可以将一整篇产品需求文档（PRD）粘贴给它，然后连续就文档中不同部分的问题进行提问。128K版本能更好地关联上下文，给出更一致的答案。

4.2 功能全面开源

ChatGLM3-6B系列，包括这个128K版本，在开源上做得非常彻底：

完全开源：模型权重对学术研究完全开放。
免费商用：只需填写简单的登记问卷，也允许免费商业使用，这对个人开发者和初创公司非常友好。
序列完整：除了我们用的对话模型，还开源了基础模型和长文本基础模型，方便研究人员进行微调和深度开发。

4.3 全新的Prompt格式与原生支持

ChatGLM3采用了全新设计的对话格式，原生（即内置）支持工具调用和代码解释器。这意味着你不需要通过复杂的提示词工程去“诱导”或“欺骗”模型拥有这些能力，而是可以直接、稳定地使用它们。这大大降低了开发门槛，提高了功能的可靠性。

5. 总结与下一步建议

通过今天的实操，我们一起完成了从部署到深度体验ChatGLM3-6B-128K的过程。我们来回顾一下重点：

部署极简：利用Ollama，我们可以通过图形界面几乎零门槛地部署和运行这个强大的模型。
能力强大：
- 代码解释器让模型成为你的数据分析伙伴，用自然语言驱动代码执行。
- 函数调用让模型成为你的系统操作员，连接外部工具和服务。
- 128K上下文让它能处理超长文本和复杂对话，记忆力超群。
应用广泛：无论是快速分析数据、自动化办公流程、构建智能客服，还是作为编程学习助手，它都能大显身手。

给你的下一步建议：