news 2026/4/16 13:39:26

【mac 私有化大模型】

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【mac 私有化大模型】

mac 私有化大模型

Ollama安装

Ollama = 面向本地/私有部署的大模型运行时 + 模型管理器
封装了llama.cpp + Metal,并提供 OpenAI 风格 API

brew安装

brewinstallollama qp@qp-mac ~ % brewinstallollama==>Fetching downloads for: ollama ✔︎ Bottle ollama(0.13.5)[Downloaded10.8MB/10.8MB]==>Pouring ollama-0.13.5.arm64_sequoia.bottle.tar.gz==>Caveats To start ollama now and restart at login: brew services start ollama Or,ifyou don't want/need a backgroundserviceyou can just run:OLLAMA_FLASH_ATTENTION="1"OLLAMA_KV_CACHE_TYPE="q8_0"/opt/homebrew/opt/ollama/bin/ollama serve==>Summary 🍺 /opt/homebrew/Cellar/ollama/0.13.5:8files,30.1MB==>Running`brew cleanup ollama`... Disable this behaviour by setting`HOMEBREW_NO_INSTALL_CLEANUP=1`.Hide these hints with`HOMEBREW_NO_ENV_HINTS=1`(see`manbrew`).

配置局域网可以访问

exportOLLAMA_HOST=0.0.0.0:11434 brew services restart ollama

启动ollama

qp@qp-mac ~ % brew services start ollama==>Successfully started`ollama`(label: homebrew.mxcl.ollama)

默认端口:11434

验证

http://127.0.0.1:11434# orcurlhttp://127.0.0.1:11434/api/tags# orqp@qp-mac ~ %lsof-i -n -P|grepollama ollama43081qp 4u IPv4 0xc5e6c9b631d67461 0t0 TCP127.0.0.1:11434(LISTEN)ollama43081qp 9u IPv4 0xf2f010455ddbff8d 0t0 TCP127.0.0.1:11434->127.0.0.1:53521(ESTABLISHED)ollama43081qp 10u IPv4 0x9e8ee2687fbe3b7 0t0 TCP127.0.0.1:11434->127.0.0.1:53522(ESTABLISHED)

查看版本

ollama --version

brew 查看启动

brew services list

Ollama 拉取大模型

pull

ollama pull qwen2.5:7b pulling manifest pulling 2bada8a74506:100% ▕███████████████████████████████████████████████████████████████████████████████████▏4.7GB pulling 66b9ea09bd5b:100% ▕███████████████████████████████████████████████████████████████████████████████████▏68B pulling eb4402837c78:100% ▕███████████████████████████████████████████████████████████████████████████████████▏1.5KB pulling 832dd9e00a68:100% ▕███████████████████████████████████████████████████████████████████████████████████▏11KB pulling 2f15b3218f05:100% ▕███████████████████████████████████████████████████████████████████████████████████▏487B verifying sha256 digest writing manifest success

list

qp@qp-mac ~ % ollama list NAME ID SIZE MODIFIED qwen2.5:7b 845dbda0ea484.7GB6minutes ago

run

ollama run qwen2.5:7b qp@qp-mac ~ % ollama run qwen2.5:7b>>>你是谁 我是Qwen,一个由阿里云开发的语言模型助手。我旨在提供帮助和互动,解答用户的问题或进行对话。你可以问我任何问题或者和我聊天,我会尽力给你最好的 回答。>>>Use Ctrl + d or /bye to exit.>>>/bye
# 再次输入qp@qp-mac ~ %curlhttp://127.0.0.1:11434/api/tags{"models":[{"name":"qwen2.5:7b","model":"qwen2.5:7b","modified_at":"2026-01-09T09:14:34.15044164+08:00","size":4683087332,"digest":"845dbda0ea48ed749caafd9e6037047aa19acfcfd82e704d7ca97d631a0b697e","details":{"parent_model":"","format":"gguf","family":"qwen2","families":["qwen2"],"parameter_size":"7.6B","quantization_level":"Q4_K_M"}}]}

tips

  1. 使用ollama run qwen2.5:7b是可以在终端中直接对话,这是一个 REPL 交互模式

    • 会占用当前终端
    • 关闭终端 / Ctrl+C 会话结束
    • 不适合长期服务或多用户
  2. 接入webui 不需要ollama run

    Web UI / 程序调用Ollama,用的是 HTTP API,不是ollama run

    • ollama serve(或 brew service 启动)
    • 提供一个 长期运行的模型服务
    • 默认端口:11434
    • 只要 Ollama 服务在运行,Web UI 就能直接用。

配置 web-ui

docker 镜像拉取

dockerrun -d\--name open-webui\-p3000:8080\-eOLLAMA_BASE_URL=http://host.docker.internal:11434\--restart unless-stopped\ghcr.io/open-webui/open-webui:main

启动需要大改10分钟左右

# 本地访问 http:/127.0.0.1:3000 就可以了# 配置账号密码 admin 123123 就可以使用
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 4:46:57

Sambert-HifiGan在金融行业的智能语音助手应用

Sambert-HifiGan在金融行业的智能语音助手应用 引言:语音合成如何重塑金融服务体验 随着金融科技的持续演进,客户对服务效率与交互体验的要求日益提升。传统客服系统中机械、单调的语音播报已难以满足用户对“人性化”沟通的期待。在此背景下&#xff0c…

作者头像 李华
网站建设 2026/4/17 5:36:48

CSDN博主亲测:万元级显卡运行体验全记录

CSDN博主亲测:万元级显卡运行体验全记录 Image-to-Video图像转视频生成器 二次构建开发by科哥本文基于RTX 4090(24GB)真实环境实测,完整记录从部署到调参的全流程性能表现与工程优化建议。运行截图📖 技术背景与项目定…

作者头像 李华
网站建设 2026/4/17 3:18:15

D2Admin企业级后台管理系统终极指南:从零到部署的快速上手

D2Admin企业级后台管理系统终极指南:从零到部署的快速上手 【免费下载链接】d2-admin 项目地址: https://gitcode.com/gh_mirrors/d2a/d2-admin 还在为复杂的后台系统开发而困扰?面对权限管理、主题定制、状态维护等难题感到无从下手&#xff1f…

作者头像 李华
网站建设 2026/4/15 18:02:13

如何用Sambert-HifiGan为短视频自动生成旁白?

如何用Sambert-HifiGan为短视频自动生成旁白? 引言:中文多情感语音合成的现实需求 在短视频内容爆发式增长的今天,高质量、富有情感表现力的旁白配音已成为提升用户观看体验的关键因素。传统人工配音成本高、效率低,而普通TTS&…

作者头像 李华
网站建设 2026/4/10 18:15:03

当多态在构造中“失效”的那一刻

凌晨两点,我的手机突然震动起来。屏幕上显示着同事小张的名字——一位有着五年经验的C开发者。接起电话,那头传来他困惑而急切的声音: “我刚刚在调试一个奇怪的崩溃问题。在基类的构造函数中调用了一个虚函数,但它没有按我预期的…

作者头像 李华
网站建设 2026/4/16 21:39:58

Sambert-HifiGan语音合成API调用最佳实践

Sambert-HifiGan语音合成API调用最佳实践 📌 引言:中文多情感语音合成的现实需求 随着智能客服、有声阅读、虚拟主播等AI应用场景的普及,传统“机械式”语音合成已无法满足用户对自然度与情感表达的需求。尤其在中文语境下,语气…

作者头像 李华