news 2026/1/30 4:56:14

线性代数思维重构第一章:向量空间

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
线性代数思维重构第一章:向量空间

最近由于平时跟本科的学生交流,和自己一些朋友在AI领域进行讨论时,发现他们对线代的理解还是相对不够深入,所以我想根据《线性代数应该这样学》这本书,通过自己的浅薄理解,来为大家开拓一个更高的线代视野,以帮助大家学习更深刻的思维。

这可能是你第二次接触线性代数.初次接触这个学科时,你可能偏重欧几里得空间(Eu clidean space)和矩阵;这次相逢则不同,将聚焦于抽象的向量空间和线性映射.这些术语将 在后面定义,所以如果你不知道它们的意思也不用担心.

由于原书是英文,中文翻译过来之后其实挺晦涩的,讲解也很专业化,所以你可以看我的大白话讲解之后再去做习题,不做也没关系,我们并不是要完成100分理解,我们完成80分即可,100分留给数学专业的学生吧。

PDF地址:Linear Algebra Done Right

线性代数是研究有限维向量空间上的线性映射的学问.我们最终会理解这些术语的具体 含义.在本章中,我们将定义向量空间并讨论它们的基本性质. 在线性代数中,如果将复数与实数放在一起研究,就会得到更好的定理和更深刻的见解. 因此,我们将从介绍复数及其基本性质开始.

第一回:构建基石——标量域与坐标空间

《线性代数应该这样学》与传统教材最大的不同,在于它从一开始就极度强调一般性结构。在进入“向量空间”这个抽象定义之前,我们必须先通过最具体的数学对象——数和列表,来确立线性代数运算的基本法则。

本部分将涵盖以下核心概念的严密定义:

  1. 复数系统及其代数性质。

  2. 标量域的抽象统一。

  3. 空间的定义及其运算逻辑。

1. 复数系统的代数本质 ()

线性代数不仅仅是在实数域上的游戏。为了理解特征值、算子分解等高阶概念,我们必须引入复数。Axler 在开篇即引入,意在表明:实数只是复数的一个特例(子集)。

1.1 定义与基本运算

我们定义复数为一个有序对,通常写作,其中满足

  • 加法:

  • 乘法 :

1.2 关键性质(实例验证)

理解复数的关键不在于它的几何意义(复平面旋转),而在于它保持了算术的封闭性完备性

实例 1:乘法的封闭性与实部虚部混合

注意:虽然的实部虚部都是正数,但乘积的实部变成了负数。这是线性变换中“旋转”特性的代数体现,但在第一章,我们只关注运算结果的确切性。

1.3 为什么需要复数?

考虑方程。在中无解,但在中有解。线性代数中,寻找“特征值”本质上就是解多项式方程。如果局限于,许多算子将“无解”(没有特征值)。因此,提供了更完整的代数环境。

2. 标量域的抽象

这是本书逻辑严密性的第一个体现。作者不想把定理写两遍(一遍给实数,一遍给复数)。因此,引入符号

2.1 定义

在本书中,既可以代表实数域,也可以代表复数域

中的元素被称为标量

2.2 域的潜台词

虽然 Axler 没有花费大量篇幅讲解群论中的“域”(这是另外的部分了,我们还是暂时不要深入到群论),但他罗列的性质暗示了必须满足极其严格的代数结构。对于任意,必须满足:

  1. 交换律 :,

  2. 结合律 :,

  3. 分配律 :

  4. 单位元 :存在,使得,

  5. 逆元 :存在加法逆元和乘法逆元

逻辑推论:

如果不满足上述性质(例如整数集合,因为它没有乘法逆元,如),就不能作为线性代数的标量域。线性代数的所有定理,都建立在这些基础算术公理之上。

3. 列表与空间

在定义抽象的“向量空间”之前,我们先研究一个最具体的例子:。这是所有向量空间的原型(Prototype)。

3.1 列表的严格定义

是非负整数。一个长度为的列表个元素的一个有序排列(Ordered mathematical objects),记作:

其中是第个坐标。

关键区别:列表 vs 集合

  • 顺序重要性:列表;集合

  • 重复性:列表是合法的且长度为 2;集合长度为 1。

  • 结论:线性代数处理的是位置敏感的数据结构。

3.2的定义

是所有长度为的、元素来自的列表的集合:

实例 2:区分空间维度

  • : 实数对,如

  • : 复数对,如

  • : 实数三元组,如

3.3 定义上的运算

仅仅有一堆列表是不够的,我们需要定义它们之间如何通过代数发生关系。我们在上定义两种基本运算。

A. 坐标加法

对于,它们的和定义为:

逻辑验证:只有当两个列表长度相同时,加法才有定义。这是由“有序列表”的结构决定的。

B. 标量乘法

对于,积定义为:

实例 3:中的运算

,向量

这个例子展示了标量域的运算规则如何直接渗透进的每一个坐标中。

4. 迈向抽象的第一步

在此阶段,我们得到了什么?

  1. 我们有了标量),它们遵循算术规则。

  2. 我们有了向量中的列表),它们可以相加,也可以被标量缩放。

  3. 我们定义了向量:

  4. 我们定义了加法逆元:

逻辑上的伏笔:

Axler 在第一章第一节仅停留在这里。他没有把称为“唯一的”向量空间。相反,他在暗示:任何对象的集合,只要能像这样由“加法”和“标量乘法”操纵,并且满足类似的律法,它就是一个向量空间。

只是具体且特殊的例子,而不是定义

第二回:灵魂的提取——向量空间的公理化定义

0.向量空间具象理解

在数学里,“空间” 就是一个“集合”。也就是“一堆东西的合集”。

一堆苹果,是一个集合。

一堆箭头,是一个集合。

一堆函数,是一个集合。

但是,普通的集合是很散乱的。比如“一堆苹果”,你把两个苹果“加”在一起是什么意思?没意义。你把一个苹果“乘 3”是什么意思?变大三倍吗?不确定。

向量空间,就是在这个集合上加了两条钢铁般的规则,让这堆东西变得极其守纪律

要把一个普通的“集合”晋升为“向量空间”,它必须保证你在里面怎么“折腾”,都永远跑不出去

这就好比一个完美的封闭宇宙。在这个宇宙里,你只能做两个动作:

动作 1:伸缩(标量乘法)

规则:你手里拿一个东西,如果你把它拉长(乘 2)、缩短(乘 0.5)、甚至反向拉(乘 -1),得到的新东西必须还在这个宇宙里

动作 2:合成(加法)

规则:你左手拿一个东西,右手拿一个东西,把它们“加”在一起,得到的新东西必须还在这个宇宙里

为了彻底听懂,请你脑海中浮现出一张无限大的平展白纸(这是一个二维平面)。

原点(零向量):纸中心有一个红点。这是必须有的,它是世界的中心。

向量:从红点出发,画向纸上任意一点的箭头。

验证它是向量空间:

伸缩:你把任何一个箭头拉长两倍,箭头还在纸上吗?在。(因为纸是无限大的)。

合成:你随便画两个箭头,把它们首尾相接拼起来,终点还在纸上吗?在。(因为纸是平的)。

这就是向量空间:一个平坦的、无限延伸的、包含原点的世界。

为什么叫“向量”而不叫“箭头”?

之所以这本书叫《线性代数应该这样学》,是因为 Axler 想告诉你:不要只盯着箭头看。

只要满足上面那个“永不越界”的游戏规则,任何东西都是向量。

例子:声音(波形)想象所有的声音波形。

  • 伸缩:你把一段声音的音量放大一倍(乘 2),它还是声音吗?是。

  • 合成:你同时播放两段声音(加法),它们混合在一起,这还是声音吗?是。

  • 原点:静音(波形为0)。

  • 结论:声音波形构成了一个向量空间!

在这里,一段波形就是一个“向量”。处理声音的算法,本质上就是在做线性代数运算。

向量空间就是一个封闭的操作台。在这个台子上,任何对象都可以被拉伸,也可以被叠加,而且无论怎么操作,生成的新对象永远不会掉出这个台子。”

  • 关键点 1:必须有原点()。

  • 关键点 2:必须是直的、平的(加法封闭)。

  • 关键点 3:必须是无限延伸的(乘法封闭)。

现在,我们要进行一次思维上的飞跃:剥离具体形式,提取代数灵魂。我们将不再关心“向量”长什么样(是一列数?是一个函数?还是一个矩阵?),我们只关心它们如何运算

这就是向量空间(Vector Space)的公理化定义。这是线性代数最庄严的时刻,因为后续所有定理都将建立在这几条简短的公理之上。

1. 定义:什么是向量空间?

一个向量空间由三个要素组成:

  1. 一个集合(或许我们可以成为向量域)(其中的元素称为向量)。

  2. 一个标量域(实数域或复数域)。

  3. 两种运算:加法标量乘法

这两种运算必须满足以下公理。对于任意和任意

A. 加法的代数结构

加法必须生成一个“阿贝尔群”结构:

  • 封闭性 :

  • 交换律 :

  • 结合律 :

  • 加法单位元 :存在一个唯一的元素,使得

  • 加法逆元 :对于每个,存在唯一的,使得

B. 标量乘法的代数结构

  1. 封闭性 (Closure):

  2. 结合律 (Associativity):

  3. 乘法单位元 (Multiplicative Identity):(这里中的单位元)。

C. 分配律

这是连接加法与乘法的桥梁:

  1. 标量分配律:

  2. 向量分配律:

2. 深入理解:为什么是这些公理?

Axler 列出这些公理并非随性而为。这组公理极其精炼地定义了“线性”的本质。

  • 没有减法与除法:注意,定义中没有定义。在严格的代数结构中,减法只是加逆元(),除法只是乘倒数()。这保证了运算定义的最小化。

  • 原点的重要性:公理 A.4 强制要求空间中必须有一个“原点” 0。没有原点的几何对象(如直线)不能构成向量空间,因为它不包含零向量,违背了加法单位元的存在性。

  • 结合律的意义:公理 A.3 和 B.2 允许我们在写长串运算时省略括号。比如,无论先算哪两个,结果都一样。

3. 核心实例:超越

为了打破“向量就是一列数”的刻板印象,Axler 引入了更广泛的例子。

3.1 函数空间 $\mathbb{F}^S$

是任意非空集合。定义为从所有函数的集合。

对于,我们定义:

逻辑连接:

  • 如果,那么本质上就是。因为一个定义域为的函数,其实就是个特定的值,这正是一个长度为的列表。

  • 如果(区间),那么就是定义在上的所有实/复值函数空间。

结论:只是函数空间的一个特例。这一视角极大地扩展了向量空间的应用范围——多项式、连续函数、可微函数,它们都是向量。

向量空间太大了,我们需要在其中寻找结构。正如我们在三维空间中寻找“平面”和“直线”,在向量空间中,我们要寻找子空间(Subspaces)。我们将定义什么是子空间,以及最重要的——直和(Direct Sums),这是理解空间分解的关键。

第三回:空间的解剖学——子空间与直和

我们已经拥有了一个巨大的宇宙——向量空间。但通常我们不需要研究整个宇宙,只需要研究其中的一小块区域(比如二维平面中的一条直线)。

这就引出了一个问题:什么样的“一小块区域”才有资格被当作线性代数的研究对象?

0.具象理解:

你已经知道什么是向量空间 ()了(那个无限延伸、包含原点的完美平坦世界)。

现在,我们在里面随便圈出一块地盘,叫它子集

核心问题:这块被圈出来的,是一堆杂乱无章的碎片,还是一个“自给自足的小世界”?

如果是后者,它就是子空间

子空间 U 必须满足一个极其苛刻的逻辑条件:

如果在这个圈子 U里的人,完全不依赖外界 V,就能玩转所有的线性代数游戏,那它就是子空间。

这意味着,U 必须是一个“微缩版”的向量空间。它“寄生”在 V 里,但它自己必须拥有完整的结构。

为了证明 U 具备这种独立性,它必须通过三道“防逃逸”测试

我们以三维空间(你的房间)作为大宇宙 V。我们来看看房间里的哪些对象能通过测试。

第一道测试:原点锚定

  • 规则:

  • 直觉:任何空间都必须有中心。如果你圈的地盘里没有原点,你就失去了坐标系的“根”。

  • 实例:

    • 通过:穿过房间中心的一条激光线。

    • 失败:悬浮在天花板上的一条线(不经过原点)。

    • 逻辑后果:如果没有 0,那么加法就失效了,因为,如果不在里面,运算结果就“掉出去”了。

第二道测试:加法封闭

  • 规则:圈子里随便找两个向量,它们的和必须还在圈子里。

  • 直觉(最关键):这要求子空间必须是平直的。

  • 失败案例:十字架形状

    • 想象是地面上的轴和轴的并集(十字形)就是只有两个坐标轴,其他都没有。

    • 你在轴取个向量(合法)。

    • 你在轴取个向量(合法)。

    • 加法:

    • 结果:轴和轴之间的区域,它掉出去了!

    • 结论:弯曲的、折断的、拼接的形状(如十字架、圆圈、双曲线)都会在加法这一关挂掉。只有直线、平面这种“平”的东西才能过关。

第三道测试:数乘封闭

  • 规则:圈子里随便拿个向量,随便乘个数字,结果必须还在圈子里。

  • 直觉:这要求子空间必须是无限延伸的。

  • 失败案例:线段

    • 想象是从原点出发,长度只有 1 米的一根短棍。

    • 你在里面拿个向量(长度 0.5)。

    • 数乘:乘上 10。

    • 结果:长度变成 5。它戳出去了!

    • 结论:有边界的东西(正方形、球体、线段)统统不行。子空间必须向两头无限延伸。

为了让你心里有底,我们可以把三维空间所有的子空间列一张清单。除了这四类,再无其他。

  • 零维子空间:

    • 内容:只有原点

    • 解释:它是最小的。如果你只待在原点,不管怎么加、怎么乘,你永远还是 $0$。完美封闭。

  • 一维子空间:

    • 内容:所有过原点的直线

    • 解释:只要这根线是无限长且直的,且经过原点,你在上面怎么爬(加法、数乘),都永远掉不下去。

  • 二维子空间:

    • 内容:所有过原点的平面

    • 解释:只要这个面是平的、无限大的,且经过原点。比如桌面无限延伸,你在桌面上画箭头相加,永远不会飞到空中去。

  • 三维子空间:

    • 内容:整个自己。

    • 解释:最大的子空间就是它本身。

什么是子空间?

它必须同时满足:

  1. 有根(包含原点)。

  2. 平直(加法不产生新方向)。

  3. 无限(数乘不产生越界)。

用一句话说:子空间是过原点的线性平坦结构。

1. 子空间 (Subspace):宇宙中的小宇宙

接下来进入数学抽象!

1.1 什么是子空间?

想象是全集。我们取的一个子集(即)。

如果这个完全继承的所有优良性质,使得我们在内部进行加法和数乘时,永远不会“掉出”这个圈子,那么就是的一个子空间

1.2 严格判据

要证明 U 是 V 的子空间,必须且只需检查以下三个条件。这三个条件缺一不可,必须死记硬背且深刻理解:

1.零向量存在

深度解析:为什么必须有 0?因为线性代数不仅研究“形状”,还研究“结构”。没有原点(0)的对象(比如平面上 x=1 这条直线)不具备代数结构——你没法在这个集合里找到一个元素加它等于它自己。只要没有 0,直接判死刑,不是子空间。

2.加法封闭

如果,那么

深度解析:比如你在这个圈子里随便找两个东西加起来,结果跑出去了,那这个圈子就是“破”的,不是完备的子空间。

3.标量乘法封闭

如果,那么

深度解析:这意味着你不能限制向量的“长度”。如果你说“我只研究长度小于 1 的向量”,这不行,因为我乘个 5,它就变长了,跑出去了。子空间必须能无限延伸。

1.3 实例与反例的深度剖析(这是理解的关键)

我们以(二维平面)为例,来看看谁是子空间,谁不是。

案例 A:过原点的直线

集合

  • 检查 1:满足吗?满足。

  • 检查 2:取两点。相加得。满足吗?满足。

  • 检查 3:取点和标量。相乘得。满足。

  • 结论:是子空间。

案例 B:不过原点的直线

集合

  • 检查 1:满足吗?

  • 结论:不是子空间。哪怕它是一条直的线,但因为丢了原点,它在线性代数里就没有地位。

案例 C:虽然有原点,但形状不对(最易错!)

集合

  • 这是什么?这是轴和轴的并集(十字架形状)。

  • 检查 1:在里面吗?在。

  • 检查 2(加法封闭):

    • (在 x 轴上,属于)。

    • (在 y 轴上,属于)。

    • 里吗?不在!因为

  • 结论:不是子空间。

  • 深意:子空间必须是“平直”的。两个子空间简单的拼凑(并集)往往不再是子空间,因为加法会把它们“混合”出新的方向。

2. 子空间的和 (Sum of Subspaces)

既然简单的“并集”(Union,)通常不是子空间(如案例 C 所示),那我们如何把两个子空间正确地结合起来呢?

2.1 定义

我们需要一种运算,能囊括的所有组合。这就是

这表示:从里拿一个向量,从里拿一个向量,加起来。把所有这种加出来的结果放在一起,就是

重要性质:是包含最小的子空间

2.2 例子

中:

  • 是 x 轴:

  • 是 y 轴:

  • (并集):只是个“十字架”,不是子空间。

  • (和):任意。这是整个 xy 平面!这是一个完美的子空间。

3. 直和 (Direct Sum):线性代数的“精确拆解”

这是第一章最难、最重要、最深奥的概念。请务必慢下来。

3.1 为什么需要“直”和?

普通的和有个缺陷:表达不唯一

想象 U 是 xy 平面,W 是 yz 平面。它们的和是整个。 取一个向量。 它可以写成吗?

  • 方式 1:,

  • 方式 2:,。加起来还是

    因为有重叠(y 轴),导致同一个向量有无数种拆分方法。这很糟糕,我们想要唯一性

3.2 直和的定义

如果 V 中的每一个向量都能唯一地(Unique)写成(其中),那么我们称直和

记作:

我们怎么知道两个空间是不是直和?去试每一个向量是否唯一太麻烦了。Axler 给出了一个极其优美的判据:

定理:是直和,当且仅当:

即:的交集只有零向量。

详细逻辑推导(为什么?):

  1. 从右往左推:如果,为什么表示就唯一了?

    • 假设(有两种写法)。

    • 那么

    • 移项整理:

    • 看左边:,因为是子空间,差也在里。所以结果

    • 看右边:,所以结果

    • 这意味着这个差值既在里,也在里。

    • 既然交集只有,那么。同理

    • 结论:只要交集为零,拆分方法就是唯一的!

几何理解:

  • 想让两个东西完全不纠缠,它们只能在原点处碰头。

  • x 轴和 y 轴就是直和关系(交集只有原点)。

  • xy 平面和 yz 平面不是直和关系(交集是 y 轴,不仅仅是原点)。

到现在,我们在脑海中构建了什么图像?

  1. 子空间是保持加法和数乘封闭的“平直”结构,且必须包含原点 $0$。

  2. 和 ()是把两个子空间“张成”一个更大的空间。

  3. 直和 ()是最完美的拼接方式:它要求两个子空间除了原点外互不干涉(),从而保证了世界上的每一个向量都能被精确、唯一地分解。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/30 4:49:50

部署Z-Image-Turbo踩坑记录,这些问题你可能也会遇到

部署Z-Image-Turbo踩坑记录,这些问题你可能也会遇到 1. 为什么选Z-Image-Turbo?不是所有“快”都一样 第一次看到“Z-Image-Turbo”这个名字时,我下意识以为又是个营销噱头——毕竟现在叫“Turbo”“Ultra”“Pro Max”的模型太多了。直到我…

作者头像 李华
网站建设 2026/1/30 4:43:04

当企业面对智能化转型,如何借助AI销冠系统提升数字员工的工作表现?

数字员工在当前智能化转型的过程中扮演着越来越重要的角色。他们通过AI销冠系统得以优化业务流程,使企业能够在竞争激烈的市场环境中保持高效和灵活。数字员工利用这一系统的智能功能,能够在客户沟通、数据处理和市场分析方面实现显著提升。他们能够快速…

作者头像 李华
网站建设 2026/1/30 4:35:49

黑芝麻智能与萝卜快跑达成战略合作,共同打造无人驾驶生态圈

1月29日,黑芝麻智能与百度旗下萝卜快跑正式签署战略合作协议。黑芝麻智能作为萝卜快跑合作范围内产品研发的算力芯片技术支撑单位,全力配合萝卜快跑产品的相关技术研究及成果转化;萝卜快跑在方案验证等方面为黑芝麻智能提供指导、支持。双方将…

作者头像 李华
网站建设 2026/1/30 4:35:10

自媒体人必备!Qwen-Image-Edit快速生成社交媒体配图技巧

自媒体人必备!Qwen-Image-Edit快速生成社交媒体配图技巧 你是不是也经历过这些时刻: 凌晨两点赶稿,突然发现缺一张应景的封面图; 临时接到选题,要为“夏日露营”配图,但手头只有张室内自拍; 发…

作者头像 李华
网站建设 2026/1/30 4:23:57

ReactNative for Harmony 项目鸿蒙化三方库集成实战:react-native-svg

📋 前言 react-native-svg 是一个强大的 SVG 渲染库,允许在 React Native 应用中创建和管理 SVG 图形。它支持路径、形状、渐变、文本、动画等多种 SVG 元素,完全兼容 Android、iOS 和 HarmonyOS 三端。 [!WARNING] 本项目为 react-native-s…

作者头像 李华
网站建设 2026/1/30 4:13:02

Qwen3-32B GPU算力适配方案:Clawdbot网关下显存占用与推理速度优化

Qwen3-32B GPU算力适配方案:Clawdbot网关下显存占用与推理速度优化 1. 方案背景与部署架构概览 你是不是也遇到过这样的问题:想把Qwen3-32B这样参数量庞大的模型用在实际对话平台里,结果一启动就爆显存,推理慢得像卡顿的视频&am…

作者头像 李华