news 2026/4/8 18:21:52

赛博炼丹新姿势!在NAS里造一个听劝的AI图片编辑网站

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
赛博炼丹新姿势!在NAS里造一个听劝的AI图片编辑网站

「NAS、键盘、路由器······年轻就要多折腾,我是爱折腾的熊猫,今天又给大家分享最近折腾的内容了,关注是对我最大的支持,阿里嘎多」

引言

大部分时候,AI都是被我们用来进行文字生成、图片生成等工作,但实际上基于AI我们也可以进行逆向操作,它不光会从零创造,更擅长对已有的文件“动手脚”,最典型的例子,就是目前各大手机厂商上的AI消除、去反光等功能。

目前咱们已知极空间的相册已经有了AI选片、照片去重、图片压缩以及对于老照片的修复、上色以及清晰度提升等功能,在相册功能这块,极空间确实是妥妥地走在了行业前沿。除此之外,通过Docker还可以把图像处理的玩法无限拓展,比如部署熊猫今天要介绍的AI-Image-Edit。

项目介绍

作为新晋项目,AI-Image-Edit目前的功能其实并不多,但它的思路很有意思。相较于传统的文生图以及图生图,AI-Image-Edit的主要功能还是集中在对图像的二次编辑上,感兴趣的可以去看看开源地址的介绍:https://github.com/chunxiuxiamo/ai-image-edit。

在首页,项目的左边有一处上传按钮,通过它可以上传图像,而右边则提供了图像的生成和编辑,因为要涉及到中文的输出,所以这里建议是使用nano-banana2。

至于nano-banana2的API,目前熊猫是没找到稳定的白嫖项目,想要使用暂时只能用半公益的站点,推荐上个人推荐老张API,在AI圈内也是比较知名的老牌API网站了,感兴趣的可以了解(非推广:https://api.laozhang.ai/register/?aff_code=rDFp)

除了gemini官方,也支持OpenAI接口的第三方模型,支持接口地址自定义。除此之外就是下方的图片尺寸与宽高比设置,最大支持4K的输出,不过测试4K下不支持流式传输,同时2K的输出时间要快一些,精度要求不高个人建议2K其实就够用了。

当我们需要改变一张图中的元素时,将其图片上传,随后通过画笔工具将需要修改的位置进行涂抹,最后在右边会得到编辑指令,AI会根据指令识别其中的区域,这时候就可以根据你的需求改变其中的一些元素,例如文字信息。

除了文字,也可以用于人物消除、AI扣图以及背景统一等等功能,其操作和原理其实和咱们日常手机上的相册AI相差不大,只不过因为基于Gemini3 Pro,所以它对于中文的支持更好。

项目部署

AI-Image-Edit并没有提供已经打包好的镜像供我们使用,不过作者提供了Dockerfile文件,所以你可以直接将项目下载下来之后自行构建,或者直接用熊猫构建好的容器镜像。

熊猫构建的镜像地址为:ghcr.io/panda-995/nano-banana-web:latest,针对这种非DockerHUB上的镜像,在进行镜像拉取一定记得带上站点的名称,随后通过极空间Docker仓库的自定义拉取去进行操作。

因为项目不存在环境变量以及文件存储的映射,所以我们下载好镜像之后直接在本地镜像中找到他,随后双击创建容器就行,只需要映射容器端口即可。或者直接用Compose进行拉取与容器创建。

version:'3.8'# Compose 文件版本,选择兼容主流 Docker 版本的 3.8services: nano-banana-web: image: ghcr.io/panda-995/nano-banana-web:latest container_name: nano-banana-web ports: -"8868:80"restart: always

最后通过极空间的远程访问就可以直接访问项目的首页了,项目并不具备鉴权,所以记得不要将其暴露到公网之下。

写在最后

将新兴的AI应用部署到自己的极空间NAS上,这本身就是一种乐趣,AI-Image-Edit虽然目前功能还在早期,但将新兴的AI应用部署到自己的极空间NAS上,这本身就是一种乐趣。

以上便是本次分享的全部内容了,如果你觉得还算有趣或者对你有所帮助,不妨点赞收藏,最后也希望能得到你的关注,咱们下期见!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/2 23:53:42

Qwen2.5-7B预训练模型部署:知识量增强效果实测分析

Qwen2.5-7B预训练模型部署:知识量增强效果实测分析 1. 引言:为何选择Qwen2.5-7B进行实测? 1.1 大模型演进中的知识密度挑战 随着大语言模型(LLM)在自然语言理解、代码生成和多模态任务中的广泛应用,知识覆…

作者头像 李华
网站建设 2026/4/8 13:21:12

Qwen2.5-7B部署手册:安全加固与访问控制配置

Qwen2.5-7B部署手册:安全加固与访问控制配置 1. 背景与部署目标 随着大语言模型在企业级场景中的广泛应用,模型服务的安全性与访问可控性已成为生产部署的核心要求。Qwen2.5-7B 作为阿里开源的高性能大语言模型,支持高达 128K 上下文长度、多…

作者头像 李华
网站建设 2026/3/30 19:26:31

Qwen2.5-7B支持阿拉伯语吗?小语种生成能力实测报告

Qwen2.5-7B支持阿拉伯语吗?小语种生成能力实测报告 1. 背景与问题提出 随着大语言模型(LLM)在全球范围内的广泛应用,多语言支持能力已成为衡量模型实用性的关键指标之一。尤其在“一带一路”沿线国家和中东地区,阿拉伯…

作者头像 李华
网站建设 2026/4/8 7:29:03

Qwen2.5-7B代码文档生成:从源码到说明文档

Qwen2.5-7B代码文档生成:从源码到说明文档 1. 技术背景与核心价值 1.1 大模型时代下的文档自动化需求 在当前大语言模型(LLM)快速发展的背景下,开发者面临一个共性挑战:如何高效地将复杂的代码逻辑转化为清晰、准确…

作者头像 李华
网站建设 2026/4/1 23:12:25

Qwen2.5-7B部署效率提升:并行推理与批处理实战优化

Qwen2.5-7B部署效率提升:并行推理与批处理实战优化 1. 引言:为何需要高效部署Qwen2.5-7B? 随着大语言模型(LLM)在实际业务场景中的广泛应用,模型推理的吞吐量和响应延迟成为决定用户体验和系统成本的关键因…

作者头像 李华
网站建设 2026/3/28 20:14:49

Qwen2.5-7B多任务学习:联合训练优化策略

Qwen2.5-7B多任务学习:联合训练优化策略 1. 技术背景与问题提出 随着大语言模型(LLM)在自然语言理解、代码生成、数学推理等任务中的广泛应用,单一任务微调的局限性逐渐显现。传统指令微调往往聚焦于特定任务分布,导…

作者头像 李华