news 2026/4/17 21:29:11

[机器学习-从入门到入土] 基础知识

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
[机器学习-从入门到入土] 基础知识

[机器学习-从入门到入土] 基础知识

个人导航

知乎:https://www.zhihu.com/people/byzh_rc

CSDN:https://blog.csdn.net/qq_54636039

注:本文仅对所述内容做了框架性引导,具体细节可查询其余相关资料or源码

参考文章:各方资料

文章目录

中英文

中文英文
线性回归linearregression
欠拟合underfit
过拟合overfit
代价函数cost function
正则化Regularization
随机梯度下降SGDstochasticgradient descent
方差variance
先验prior
后验posterior
线性分类linear classification
判别函数discriminantfunction
决策面decision surface
决策边界decisionboundary
最小二乘法ordinary least squares
感知器perceptron
逻辑回归logisticregression
均方误差MSEmean-squareerror
交叉熵损失cross-entropyloss
神经网络neuralnetwork
激活函数activationfunction
前向传播forwardpropagation
反向传播BPbackpropagation
有限差分finitedifferences
中心差分central differences
计算学习理论computationallearning theory
概率近似正确PACprobably approximately correct
样本复杂度sample complexity
一致性consistent
版本空间version space
不可知学习agnosticlearning
VC维VCdimension
经验误差empiricalerror
泛化误差generalizationerror
留出法hold-out
交叉验证cross validation
自助法bootstrap
性能performance
混淆矩阵confusionmatrix
查准率precision
召回率 / 查全率recall
曲线curve
相关特征relevant feature
无关特征irrelevantfeature
冗余特征redundantfeature
子集搜索subsetsearch
序列前向搜索SFSsequential forward selection
序列后向搜索SFSsequential backward selection
子集评价subsetevaluation
信息增益gain
过滤式filter
包裹式wrapper
嵌入式embedded
字典学习dictionary learning
稀疏表示sparserepresentation
降维featurereduction
主成分分析PCAprincipal components analysis
线性判别分析LDAlinear discriminant analysis
本征维度intrinsicdimension
概率PCAprobabilisticPCA
核化PCAkernel PCA
自编码器auto-encoder
流形学习manifoldlearning
等度量特征映射isomapisometric feature mapping
局部线性嵌入LLElocally linear embedding
随机近邻嵌入SNEstochastic neighbor embedding
维度灾难curse ofdimensionality
度量学习metriclearning
概率图模型probabilisticgraphicalmodel
贝叶斯网络Bayesiannetwork
马尔科夫随机场Markovrandom field
条件独立conditional Independence
团块clique
道德化moralization
图像分类image classification
目标检测objectdetection
图像分割imagesegmentation
不变性invariance
同变性equivariance
卷积convolution
膨胀/空洞dilated
通道channel
感受野receptivefield
下采样downsampling
上采样upsampling
归纳偏置inductive bias
词嵌入word embedding
词袋模型BOWbag-of-words
生成词向量Word2Vec
生成式模型generativemodel
判别式模型discriminativemodel
自回归ARautoregression
变分自编码器variational autoencoder
生成对抗网络generative adversarial network
扩散模型diffusionmodel

权重shape

常用符号:W j i , Θ j i W_{ji},\quad \Theta_{ji}Wji,Θji

反着写是为了方便乘法:

W j i W_{ji}Wji: (hidden, input+1) [加一是偏置]
x i x_ixi: (input+1,) [单个样本]
->a j = ∑ i = 0 i n p u t w j i x i , i = 1... h i d d e n a_j=\sum_{i=0}^{input}w_{ji}x_i,\quad i = 1 ... hiddenaj=i=0inputwjixi,i=1...hidden: (hidden, )

如果正着写就要转置w T w^TwT

损失函数/误差函数/代价函数/成本函数/J ( w ) J(w)J(w)

损失函数(Loss):更偏向单样本误差,记作E EE

误差函数(error):和损失函数的含义几乎等价,多用于回归任务的表述

代价函数 / 成本函数(Cost):更偏向全体样本的平均 / 总误差,记作J ( w ) = 1 m ∑ i = 1 m E ( i ) J(w)=\frac{1}{m}\sum_{i=1}^mE^{(i)}J(w)=m1i=1mE(i)

向量求导公式

∂ a x T ∂ x = ∂ a T x ∂ x = a ∂ a x T b ∂ x = b a ∂ a T x b T ∂ x = a b \frac{\partial ax^T}{\partial x}=\frac{\partial a^Tx}{\partial x} = a \\ \frac{\partial ax^Tb}{\partial x} = ba \\ \frac{\partial a^Txb^T}{\partial x} = abxaxT=xaTx=axaxTb=baxaTxbT=ab

矩阵求导公式

对函数f ( w ) = ( A w ) T ( A w ) = w T A T A w f(w) = (Aw)^T (Aw) = w^T A^T A wf(w)=(Aw)T(Aw)=wTATAw
∂ f ∂ w = 2 A T A w \frac{\partial f}{\partial w} = 2 A^T A wwf=2ATAw
对函数g ( w ) = b T w g(w) = b^T wg(w)=bTw
∂ g ∂ w = b \frac{\partial g}{\partial w} = bwg=b

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 2:42:02

零基础教程:5步轻松设置JAVA环境变量

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个面向初学者的JAVA环境变量交互式学习工具,功能:1. 分步引导式配置界面;2. 实时解释每个配置步骤的作用;3. 常见问题解答&am…

作者头像 李华
网站建设 2026/4/11 17:21:05

Cursor-Free-VIP实战:5个提升开发效率的真实案例

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个案例展示平台,展示Cursor-Free-VIP在不同场景下的应用实例。每个案例应包括:1) 问题描述;2) 使用Cursor-Free-VIP的解决方案&#xff1…

作者头像 李华
网站建设 2026/4/17 1:08:50

ARM Cortex-A交叉编译工具链与Glibc版本兼容性详解

深入理解ARM Cortex-A交叉编译中的Glibc兼容性陷阱你有没有遇到过这样的情况:在开发机上编译一切正常,程序也顺利部署到了ARM板子上,结果一运行就报错——./app: version GLIBC_2.32 not found (required by ./app)或者更糟,连mai…

作者头像 李华
网站建设 2026/4/16 11:01:03

GLM-4.6V-Flash-WEB模型在JavaScript前端交互中的应用设想

GLM-4.6V-Flash-WEB模型在JavaScript前端交互中的应用设想 如今,用户早已不满足于静态网页和简单的表单提交。他们希望网站能“看懂”图片、理解问题,甚至像真人一样对话——比如上传一张超市小票,直接问:“哪些商品最划算&#x…

作者头像 李华
网站建设 2026/4/17 17:25:36

VS Code在企业级开发中的实战应用

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个企业级VS Code工作区模板,包含:1. 多项目统一配置;2. 集成调试工具链(Docker、Kubernetes);3. 团队…

作者头像 李华