news 2026/5/11 7:36:07

4.自注意机制__self-attention

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
4.自注意机制__self-attention

自注意机制也是一个常见的network架构

目前来说,输入都是一个向量,但是如果我们的输入变成了一排向量并且数目可以改变呢?这就是自注意机制解决的问题,现在model每次输入的sequence长度都不一样,如下图

假设network现在要进行文字处理,那么每一个输入的单词都可以用一个向量来表示,所以此时我们的向量长度是可以改变的,因为每个句子的单词数不一样

如何用向量来表示一个单词呢?最简单的我们可以用one-hot-encoding,用一个很长的向量,这个

向量维度和世界上的词汇一样,每一个维度都对应一个词汇,但是这样就有一个问题, 假设每一个词汇之间都没有关系,看不出来cat和dog都是动物,apple是植物

另一个方法是word embedding,我们会给每一个词汇一个向量,这个向量是有语义的,如果把word embedding全部画出来的话,那么可能会发现,所有的动物在一起,植物在一起,所有的动词在一起,word embedding不是本次重点,不讨论

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 7:36:06

Node.js WebAssembly零拷贝图像处理

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 Node.js WebAssembly零拷贝图像处理:性能优化的革命性实践目录Node.js WebAssembly零拷贝图像处理:性能优…

作者头像 李华
网站建设 2026/5/11 7:36:04

小红删数字【牛客tracker 每日一题】

小红删数字 时间限制:1秒 空间限制:256M 网页链接 牛客tracker 牛客tracker & 每日一题,完成每日打卡,即可获得牛币。获得相应数量的牛币,能在【牛币兑换中心】,换取相应奖品!助力每日有…

作者头像 李华
网站建设 2026/5/11 7:36:03

为什么我辞去高薪开发工作?2026年反思

职业转折点:代码之外的觉醒 当我在2026年初递交辞呈时,部门主管看着远超行业均值的薪资单反复确认:"你确定要放弃年薪85万的开发岗,去做测试?" 这个看似悖论的选择背后,藏着对软件行业生态的深度…

作者头像 李华
网站建设 2026/5/11 7:36:03

开发者社区的力量:一位测试工程师的破茧之路

迷雾中的测试新人 2018年夏,当我手持手工测试用例文档站在网易大楼前时,从未想到三年后会在谷歌开发者大会分享《AI赋能的混沌工程实践》。作为日均执行200重复测试的"点点工程师",我陷入职业困局:自动化脚本无从下手&…

作者头像 李华
网站建设 2026/5/11 7:36:03

基于微信小程序的付费自习室系统源码文档部署文档代码讲解等

课题介绍本课题聚焦付费自习室行业数字化需求,设计并实现一款基于微信小程序的付费自习室系统,解决传统自习室预约繁琐、计费不透明、座位管理低效等痛点。系统以微信小程序为前端交互入口,采用Node.js搭建后端服务,搭配MySQL数据…

作者头像 李华
网站建设 2026/5/3 14:48:17

PMSM电机负载观测转矩前馈Simulink探索

PMSM电机负载观测转矩前馈simulink 基于Luenberger降阶状态观测器,包含PMSM数学模型,PMSM双闭环PI矢量控制,并添加了前馈控制,采用SVPWM调制。在电机控制领域,永磁同步电机(PMSM)因其高效、高功…

作者头像 李华