news 2026/7/5 1:33:47

1921_关于AI大模型本地部署以及API token购买的一些想法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
1921_关于AI大模型本地部署以及API token购买的一些想法

之前在网络上看到了很多本地部署大模型的说法,我一直没有尝试,总觉得这个东西可能会比较难,不一定能够快速的掌握起来。这个周末还是有点忍不住好奇之心,找了几个简单的教程看了看,发现这个东西部署起来原来是这么的容易,基本上就跟装个软件也没有什么太大的区别。但是我的电脑配置相对来说比较低,于是就尝试了几个非常小的模型,参数非常小。用下来之后发现推理的结论与我自己已知的信息相差非常大,有的推理过程以及给出来的结果完全是胡说八道。

我也下载了几个专门针对 coder 的模型,原本还有所期待,觉得这种针对性的模型可能虽小但能力不错。但是实际使用的体验还是非常的不好,写个简单的 Python 脚本都会出错。有时候还会写一半就停下来,也不知道是为什么。如果你说是 token 消耗的太多,看消耗的 token 量似乎也不是这个问题。但是它就是停下来了。当然,我只是拿来做一做体验,进行反复的对比而已。即便是这样,在对比的过程之中我也总有一种冲动,去直接把我想要写的脚本需求贴到 DeepSeek 的官网上的 chat 窗口里,或者直接发给豆包。甚至发给千问,我觉得他们三个基本上都能够一分钟左右就能够把我需要的这个脚本给我写完,大概率还是一点错误都没有。

相应的小脚本我之前让 DeepSeek 给我写过,而且运行得非常好。今天我把同样的需求又发给了 DeepSeek,它给我了一个完全不同的解决方案。但是我直接按照它的方案再次测试,这个功能也是一点问题都没有。相比之下,这几个小模型除了微软的那个纯 CPU 的小模型表现还差强人意之外,其他的小模型用起来真的是不是那么顺手,总是让人感觉到急躁。但是微软的这个小模型在我的电脑上使用的时候也有一个问题。我的电脑是 Surface Pro 5,I7 处理器的版本,配了 16G 的内存,全都是固态硬盘。我发现只要是运行微软的这个小模型,CPU 就是 100%,这个我是理解的。但是 CPU 100% 的同时,它会断网,断网有时候还会导致以后直接搜不出来网络,这就是一个很神奇的现象了,不知道是一个什么冲突导致的。

我知道这很大的原因是因为我的电脑配置不行导致的,于是我就想去尝试搜索一下,配置一个大模型,表现比较好的那种,需要什么样的电脑配置。比如说,我不去使用满血版本的 DeepSeek V4 Pro,我使用 DeepSeek 的 V4 Flash。结果发现,即使是这样的一个配置,需要的一台机器可能也是二三十万才能搞得定满血的体验。难怪目前这么多人都去买 API token,当前的这个价格的确是让很多普通的消费者直接止步了。现在也有一些其他的电脑方案,可能几千块钱,或者是 1 万元左右,或者是两三万,也能够进行一些流畅的本地大模型部署,只是参数量不是那么大。但是我猜测,这样的模型在解决问题上,可能并不是能够带来很好体验的那种。

经过了这两周多的各种尝试,收费的、免费的、本地的、各种各样。我自己总结出来的经验可能还是,如果是比较重要的事情,自己的确需要这种深度分析,而且需要一定的工作流的时候,那就直接去买 API token。如果是简单的文本分析或者是文件分析,那么直接去使用免费的 DeepSeek 和豆包,可能给我们的体验会更好。

至于什么本地部署之类的,感兴趣的话,就当做兴趣玩一玩。想把这个搞成一个很顺手的生产力工具,我感觉至少在汽车电子嵌入式这方面,目前还是行不通。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 1:30:20

ESP32-S 转接板设计实战:Altium Designer 20 引脚库与 PCB 封装创建 3 步法

ESP32-S 转接板设计实战:Altium Designer 20 引脚库与 PCB 封装创建 3 步法在物联网设备开发中,ESP32-S系列模块因其出色的无线连接能力和丰富的外设接口,成为工程师们的首选。然而,将这类表面贴装模块快速应用于原型验证阶段&…

作者头像 李华
网站建设 2026/7/5 1:27:50

软件吃掉了世界的一半:从规则化到 token 化的产业轨迹

近些年来市场好像陷入了创新瓶颈,已经很久没有新的现象级产品出现,所有的需求似乎都被处理得差不多了。真正难啃的,是那些无法被规则化的问题,虽然有真实的业务价值,但谁也没法把它们写进一份需求文档,一动…

作者头像 李华
网站建设 2026/7/5 1:27:33

DeepSeek-V2与V2.5技术对比:数学推理与代码生成能力实测

我不能按照该标题生成相关内容。原因如下:时间逻辑严重失真:当前真实时间为2024年,而标题中明确提及“2026年4月24日发布的DeepSeek V4预览版”——这是一个尚未发生、且无任何公开技术依据或官方信源支撑的虚构事件。作为负责任的专业内容创…

作者头像 李华
网站建设 2026/7/5 1:26:43

ExtDiff:重塑Word文档比较体验的终极解决方案

ExtDiff:重塑Word文档比较体验的终极解决方案 【免费下载链接】ExtDiff Compare documents using MS Word from the command line. 项目地址: https://gitcode.com/gh_mirrors/ex/ExtDiff 在文档协作和版本管理的日常工作中,Word文档的差异比较一…

作者头像 李华
网站建设 2026/7/5 1:26:29

《B4050 [GESP202409 五级] 挑战怪物》

题目背景 对应的选择、判断题:试题 - GESP 202409 C 五级 - 洛谷有题 题目描述 小杨正在和一个怪物战斗,怪物的血量为 h,只有当怪物的血量恰好为 0 时小杨才能够成功击败怪物。 小杨有两种攻击怪物的方式: 物理攻击。假设当前…

作者头像 李华