news 2026/5/30 14:13:05

layer normalization和batch normalization

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
layer normalization和batch normalization

layer normalization

常用于长序列文本处理。

https://www.bilibili.com/video/BV1jdWUzkEWc?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在样本内部做归一化,假设一个batch内有五句话(五个样本),对于第一句话,I like to eat apples有五个单词,每个单词的向量由五个维度表示,那么对每个单词的五个维度的特征值计算一个均值和方差,从而实现层归一化。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,序列长度,特征维度)===》(一个batch有几个句子,一个句子有几个单词,每个单词的特征由几个维度表示),也就是有几个单词那么就要计算几个均值和方差。

batch normalization

多应用于图像处理。

https://www.bilibili.com/video/BV1qdWUzkEad?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在一个batch中的多个样本做归一化,本质上就是对一个batch中多个图片的第i层通道一起做归一化计算,一层通道计算一次均值和方差。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,通道数,高度,宽度),每个样本对应的通道一起做归一化,那么也就是有多少层就要计算多少个均值和方差。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/25 0:12:48

【Java毕设源码分享】基于springboot+vue的古代古风生活体验交流网站的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/25 22:39:33

告别传统WinForm:用AntdUI打造现代化企业级界面

还在为WinForm应用界面陈旧而烦恼吗?想给你的桌面应用换上现代化的外衣吗?今天我要介绍的这个WinForm UI库——AntdUI,将彻底改变你对传统WinForm的认知。作为基于Ant Design设计语言的纯GDI绘图界面库,它为开发者提供了一整套专业…

作者头像 李华
网站建设 2026/5/22 12:44:44

LFIT/ITPOL企业IT政策管理工具:如何构建安全的开发环境

在当今数字化时代,企业面临着日益严峻的网络安全挑战。LFIT/ITPOL作为一套开源的企业IT政策管理工具集,为组织提供了实用的安全策略和最佳实践指南。本文将深入探讨如何利用这些政策工具来构建安全可靠的开发环境。 【免费下载链接】itpol Useful IT pol…

作者头像 李华
网站建设 2026/5/27 21:43:46

MIFARE Classic Tool终极指南:解锁NFC标签操作完整攻略

MIFARE Classic Tool终极指南:解锁NFC标签操作完整攻略 【免费下载链接】MifareClassicTool An Android NFC app for reading, writing, analyzing, etc. MIFARE Classic RFID tags. 项目地址: https://gitcode.com/gh_mirrors/mi/MifareClassicTool 探索RFI…

作者头像 李华
网站建设 2026/5/27 21:09:14

GLM-4-9B技术解密:轻量级架构如何实现超越期待的智能表现

在开源大语言模型竞争日益激烈的当下,智谱AI推出的GLM-4-9B以其精妙的架构设计和卓越的性能表现,为业界提供了一个全新的技术范式。这款仅有90亿参数的模型,在多项基准测试中超越了Llama-3-8B,甚至在某些领域接近了更大规模模型的…

作者头像 李华