news 2026/4/17 3:43:19

LORA|Omini-Kontext的配置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
LORA|Omini-Kontext的配置

Omini-kontext的Lora配置太庞大了

target_modules = "(.*x_embedder|" # 输入嵌入层 ".*transformer_blocks\\.[0-9]+\\.(norm|norm1)\\.linear|" # 所有Norm层的linear ".*transformer_blocks\\.[0-9]+\\.attn\\.(to_k|to_q|to_v|to_add_out)|" # Attention的QKV ".*transformer_blocks\\.[0-9]+\\.attn\\.to_out\\.0|" # Attention输出投影 ".*single_transformer_blocks\\.[0-9]+\\.attn\\.to_out|" # 单块Attention输出 ".*single_transformer_blocks\\.[0-9]+\\.(proj_mlp|proj_out)|" # 单块MLP投影 ".*(?<!single_)transformer_blocks\\.[0-9]+\\.ff\\.net\\.2|" # FFN第二层 ".*(?<!single_)transformer_blocks\\.[0-9]+\\.ff\\.net\\.0\\.proj|" # FFN第一层投影 ".*(?<!single_)transformer_blocks\\.[0-9]+\\.norm1_context\\.linear|" # 上下文Norm ".*(?<!single_)transformer_blocks\\.[0-9]+\\.ff_context\\.net\\.0\\.proj|" # 上下文FFN投影 ".*(?<!single_)transformer_blocks\\.[0-9]+\\.ff_context\\.net\\.2|" # 上下文FFN第二层 ".*(?<!single_)transformer_blocks\\.[0-9]+\\.attn\\.(to_add_out|add_k_proj|add_q_proj|add_v_proj))" # 额外Attention

这个配置覆盖了:

  • x_embedder(输入嵌入)

  • 所有norm层的linear(太多了!)

  • 所有attention的QKV+输出

  • 所有FFN层的投影

  • 所有context相关的层

  • 所有single_transformer_blocks

总计可能添加了数百个LoRA层!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 13:48:25

BBDown全功能指南:打造个人视频资源库的终极利器

BBDown全功能指南&#xff1a;打造个人视频资源库的终极利器 【免费下载链接】BBDown Bilibili Downloader. 一款命令行式哔哩哔哩下载器. 项目地址: https://gitcode.com/gh_mirrors/bb/BBDown 在数字内容爆炸的时代&#xff0c;如何高效保存和管理优质视频资源成为众多…

作者头像 李华
网站建设 2026/4/16 13:27:17

力扣139

/* 还是和决策树一样&#xff0c;从s的第0个位置开始遍历&#xff0c; 然后只要word是s的子串&#xff0c;那么则置为true&#xff0c;而且要注意边界条件 */ class Solution { public:bool wordBreak(string s, vector<string>& wordDict) {vector<bool> dp(s…

作者头像 李华
网站建设 2026/4/16 12:09:13

终极指南:3分钟掌握Vue3低代码平台,让开发效率飙升500%

终极指南&#xff1a;3分钟掌握Vue3低代码平台&#xff0c;让开发效率飙升500% 【免费下载链接】vite-vue3-lowcode vue3.x vite2.x vant element-plus H5移动端低代码平台 lowcode 可视化拖拽 可视化编辑器 visual editor 类似易企秀的H5制作、建站工具、可视化搭建工具 …

作者头像 李华
网站建设 2026/4/16 12:19:47

Windows平台Miniconda安装教程:告别Anaconda臃肿问题

Windows平台Miniconda安装与高效环境管理实战指南 在人工智能项目日益复杂的今天&#xff0c;你是否曾遇到过这样的场景&#xff1a;刚跑通一个PyTorch模型&#xff0c;却因为另一个项目需要TensorFlow而陷入依赖冲突&#xff1f;或者接手同事代码时&#xff0c;发现“在我机器…

作者头像 李华
网站建设 2026/4/16 12:01:27

大麦抢票神器DamaiHelper:告别手速焦虑的智能解决方案

还在为抢不到心仪的演唱会门票而烦恼吗&#xff1f;&#x1f3b5; 面对秒光的热门场次&#xff0c;手动操作往往力不从心。DamaiHelper作为一款专为大麦网设计的自动化抢票工具&#xff0c;将彻底改变你的购票体验&#xff0c;让你轻松拥有心仪演出的入场券&#xff01; 【免费…

作者头像 李华
网站建设 2026/4/16 11:57:44

掌握.NET调试:dnSpy异常分析与堆栈跟踪终极指南

掌握.NET调试&#xff1a;dnSpy异常分析与堆栈跟踪终极指南 【免费下载链接】dnSpy 项目地址: https://gitcode.com/gh_mirrors/dns/dnSpy 在.NET开发中&#xff0c;你是否经常遇到"对象引用未设置到实例"这类让人头疼的异常&#xff1f;当程序在运行时抛出异…

作者头像 李华