线代[8]|北大丘维声教授《怎样学习线性代数?》(红色字体为博主注释)
文章目录
- 说明
- 一、线性代数的内容简介
- 二、学习线性代数的用处
- 三、线性代数的特点
- 四、学习线性代数的方法
- 五、更新时间记录
说明
文章中红色字体为博主敲录完丘教授这篇文章后所加,刷到这篇文章的读者在首次阅读应当跳过红色字体,先通读一读文章全文,一遍,两遍,甚至是三遍以上。
该篇文章为大学工科专业线性代数课程脉络的梳理性质文章,仅仅到“二次型”为止与考研大纲相同,并未涉及“哈密顿—凯莱定理、奇异值分解(SVD)、广义逆矩阵、多项式理论、群环域、一元多项式、多元多项式、双线性函数、若当标准型、谱定理、仿射空间、射影空间、张量积、外代数”等偏拔高性质的代数内容。在我个人印象中有一本很火的英文翻译教材《线性代数应该这样学》,这本书适合学完高等代数后来阅读,初学线性代数者切勿跳级阅读。
初学线性代数的同学们一定想了解,线性代数的主要内容是什么?学习线性代数有哪些用处?这门课程有什么特点?学习时应注意什么?本文想就这几个方面的问题谈谈自己的体会。(注:该篇文章是北京大学著名数学教授丘维声先生在中央电大担任数学讲师,教授线性代数课程时,论述关于如何学好线性代数的综合文章。)
一、线性代数的内容简介
同学们在中学里都学过代数(即初等代数)。初等代数的主要内容是:研究数及运算。 由于用字母表示数,因此应用题可以列方程来解,解方程就成为初等代数的一个中心议题。(博主:1《数学原来可以这样学:初中篇》西成活裕,2《什么是初中数学》柏干、范兴亚、李岩,3《什么是初中物理》张虎岗,4《中考数学复习微专题讲座》易良斌,5《全解全练:中考数学压轴题》李静文,6《初中数学、高中数学脱节知识补缺教材》赵南平,7《初中数学知识补习课本》丘维声,8《中学代数研究》张奠宇、张广祥、宋乃庆,9《小学数学教材中的大道理——核心概念的理解和呈现》张奠宇、巩子坤、任敏龙、殷文娣,10~11《核心素养立意下的高中数学课程教材研究(上、下)》章建跃,12~17 初中数学千题解系列六册《二次函数与相似》、《中考压轴题》、《代数综合与圆》、《一次函数与四边形》、《反比例与最值问题》、《全等与几何综合》。2025.2.22 20:24)
由于初等代数研究的是数的运算和方程,所以代数的方法其优点在于可以运算,正因为这样,人们很早就运用代数的方法去研究几何图形的性质,即建立坐标系,用坐标表示点,用方程表示图形,这就是解析几何。线性代数正是随着解析几何的研究而发展起来的。
在解析几何里我们知道: 在平面上直线的方程是一次方程,反之,任一个二元一次方程在平面上表示一条直线。由于这个几何直观,通常把一次方程称为线性方程。当然,这里“线性”的意思是指变量的次数是一次,并不是说,线性方程都表示直线。事实上,在空间中,一次方程表示一个平面。在几何里,经常要求几个平面的交点,这转化为代数上就是要解三元一次方程组,即三个未知量的线性方程组。数学的各个分支、物理及许多实际问题则进一步提出要解几个未知量的线性方程组(1),其中: x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn 是未知量; a i j a_{ij} aij表示第 i 个方程中 x j x_j xj 的系数; b j b_j bj 称为常系数。
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 ⋮ a s 1 x 1 + a s 2 x 2 + ⋯ + a s n x n = b s ( 1 ) \mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ \vdots\\ a_{s1}x_1+a_{s2}x_2+\cdots+a_{sn}x_n=b_s \end{array}\right.}(1) ⎩ ⎨ ⎧a11x1+a12x2+⋯+a1nxn=b1a11x1+a12x2+⋯+a1nxn=b1⋮as1x1+as2x2+⋯+asnxn=bs(1)
线性方程组(1)在什么时候有解?如何求解?解的结构如何?这就是线性代数要研究的第一个问题。在求解线性方程组时,行列式是一个重要的工具,所以先要研究行列式。线性方程组完全被它的全部系数和常数项所决定,至于未知量用什么符号表示是没有什么关系的。因此,线性方程组(2)可以用下面这张表来表示。这种由一些数排列成的若干行(横的)、若干列(纵的)所组成的表称为一个矩阵。于是研究线性方程组就转化为研究矩阵。
[ a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a s 1 a s 2 ⋯ a s n b n ] ( 2 ) \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}&b_1\\ a_{21}&a_{22}&\cdots&a_{2n}&b_2\\ \vdots&\vdots&&\vdots&\vdots\\ a_{s1}&a_{s2}&\cdots&a_{sn}&b_n \end{bmatrix}(2) a11a21⋮as1a12a22⋮as2⋯⋯⋯a1na2n⋮asnb1b2⋮bn (2)
除了线性方程组之外,还有大量的各种各样的问题也都提出矩阵的概念,譬如,解析几何中,平面直角坐标系的转轴公式为式(3)。
{ x = x ′ cos θ − y ′ sin θ y = x ′ sin θ + y ′ cos θ ( 3 ) \begin{cases} x=x'\cos\theta-y'\sin\theta\\ y=x'\sin\theta+y'\cos\theta \end{cases}(3) {x=x′cosθ−y′sinθy=x′sinθ+y′cosθ(3)显然,新旧坐标之间的关系完全可以通过公式(3)中的系数排列成矩阵(4)表示出来。(博主:该矩阵为旋转矩阵。凡是在平面直角坐标系上进行旋转变换的向量,皆可用原向量左乘该矩阵求出的旋转后的向量。2025.2.17 21:30)
[ cos θ − sin θ sin θ cos θ ] ( 4 ) \begin{bmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{bmatrix}(4) [cosθsinθ−sinθcosθ](4)
矩阵是线性代数的一个主要研究对象。矩阵已经不是数,而是由一些数排列成的一张表,但是矩阵可以像数那样进行运算。矩阵的运算有加法、数量乘法、乘法等。矩阵由于可以进行运算,因此它的用途就很广,特别是矩阵的乘法很独特,矩阵的应用很多就是由矩阵的乘法而来的。矩阵除了可以进行运算外,还可以进行一些交换变成较简单的矩阵,根据不同问题的需要,对矩阵进行不同的变换。矩阵的变换有 初等变换、合同变换、相似变换 等。由于矩阵可以进行运算和交换,因此它成为了一个强有力的数学工具,希望同学们像熟练掌握微积分一样熟练掌握矩阵。
在解析几何中,平面上二次曲线的一般方程是
a x 2 + 2 b x y + c y 2 + 2 d x + 2 e y + f = 0 ( 5 ) ax^{2}+2bxy+cy^{2}+2dx+2ey+f=0(5) ax2+2bxy+cy2+2dx+2ey+f=0(5)
为了研究这条曲线二次曲线的性质,需要坐标变换,把方程(5)化成标准方程。如果方程(5)中没有交叉项(即 x y xy xy项),那么只需要配方,然后作移轴就可以化成标准方程了,于是关键在于如何消去交叉项,而这实质就是把式(6)化成平方和的形式(7)。
a x 2 + 2 b x y + c y 2 ( 6 ) → a ′ x ′ 2 + c ′ y ′ 2 ( 7 ) ax^{2}+2bxy+cy^{2} (6) \rightarrow a'x'^{2}+c'y'^{2}(7) ax2+2bxy+cy2(6)→a′x′2+c′y′2(7)
式(6)是 x x x 和 y y y 的二次齐次多项式,简称为 x x x, y y y 的二次齐次或二次型。于是把二次曲线方程(5)化成标准方程的关键是要把二次型(6)化成平方和(7)的形式。因此,二次曲线问题的提出需要研究二次型。此外,数学的其他分支以及物理力学中也常常会碰到二次型。(博主:线性代数里的二次型与微分几何【第一基本形式、第二基本形式】、概率论与数理统计【概率密度函数】、经典力学【动能、势能】、电动力学【电场能量密度、磁场能量密度】均有关联。这一段文字来自豆包大模型。2025.2.17 21:50)在研究二次型时,矩阵是一个有力的工具。
在解析几何中研究了向量。我们知道向量可以进行运算,有加法、数量乘法运算等,并满足加法交换律等八条运算规律(以下简称八条规律 )。
向量满足的八条规律通常是指向量空间的公理。一个向量空间是定义在某个域上的一个集合,其中的元素称为向量。
- 1、加法封闭性:对于向量空间中的任意两个向量 u 、 v u、v u、v,它们的和 u + v u+v u+v 也在向量空间中。
- 2、加法结合律:对于向量空间中的任意三个向量 u 、 v 、 w u、v、w u、v、w,有 ( u + v ) + w = u + ( v + w ) (u+v)+w=u+(v+w) (u+v)+w=u+(v+w)。
- 3、加法交换律:对于向量空间中的任意两个向量 u 、 v u、v u、v,有 u + v = v + u u+v=v+u u+v=v+u 。
- 4、加法单位元:存在一个向量 0 0 0(零向量),使得对于向量空间中任意一个向量 u u u,有 u + 0 = u u+0=u u+0=u。
- 5、加法逆元:对于向量空间中的任意一个向量 u u u,存在一个向量 − u -u −u(负向量),使得 u + ( − u ) = 0 u+(-u)=0 u+(−u)=0。
- 6、数乘封闭性:对于向量空间中的任意一个向量 u u u 和域中的任一个标量 c c c,它们的数乘 c u cu cu 也在向量空间中。
- 7、数乘对向量加法的分配律:对于向量空间中的任意两个向量 u 、 v u、v u、v,以及域中的任意一个标量 c c c,有 c ( u + v ) = c u + c v c(u+v)=cu+cv c(u+v)=cu+cv 。
- 8、数乘对域加法的分配律:对于向量空间中的任意一个向量 u u u ,以及域中任意两个标量 c c c 和 d d d,有 ( c + d ) u = c u + d u (c+d)u=cu+du (c+d)u=cu+du。
除以上8条外,实际上还有两条关于数乘的规律:
- 9、数乘的结合律:对于向量空间中的任意一个向量 u u u ,以及域中的任意两个标量 c 、 d c、d c、d,有 ( c d ) u = c ( d u ) (cd)u=c(du) (cd)u=c(du)
- 10、数乘的单位元:对于向量空间中的任意一个向量 u u u,有 1 u = u 1u=u 1u=u,其中 1 就是域中的乘法单位元。
综述,向量空间中的公理共有十条,但课本上通常只有八条,因为最后两条是关于数乘的额外规则。
在研究线性方程组时,一个线性方程 a 1 x 1 + a 2 x 2 + ⋯ + a n x n = b a_1x_1+a_2x_2+\cdots+a_nx_n=b a1x1+a2x2+⋯+anxn=b 可以用有序数组 ( a 1 , a 2 , a n , b ) (a_1,a_2,a_n,b) (a1,a2,an,b) 表示,这种有序数组也称为向量。一个 n n n 元有序数组 ( a 1 , a 2 , . . . , a n ) (a_1,a_2,...,a_n) (a1,a2,...,an) 称为一个 n n n 维向量。 n n n 维向量之间也可以规定加法和数量乘法两种运算,这两种运算同样满足八条规律。矩阵也有加法、数量乘法,并且这两种运算也滞足八条规律。像向量、矩阵这些对象已经不是数,但是它们都有加法、数量乘法这两种运算(加法、数量乘法称为线性运算),并且满足加法交换率等八条规律。这样的一些对象很多,譬如,多项式、连续函数等也都具有加法、数量乘法两种运算,且满足八条规律。代数是研究运算的,线性代数就是研究具有加法、数量乘法这两种线性运算的集合。 像向量组成的集合、矩阵组成的集合,都是具有两种线性运算,且满足八条规律的集合,这样的集合就称为线性空间。线性空间是线性代数研究的最基本的对象。解析几何里,全体向量组成的集合就是一个线性空间。我们都知道,若取定了三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1、e2、e3,则空间中任何一个向量 a a a 都以表示成 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1、e2、e3 的线性组合: a = x 1 e 1 + x 2 e 2 + x 3 e 3 a=x_1e_1 +x_2e_2+x_3e_3 a=x1e1+x2e2+x3e3 。这说明通过三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1、e2、e3 就能表示出空间中的全部向量,于是称这空间是三维的,并且称这三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1、e2、e3 是这空间的一组基维数和基的概念可以推广到抽象的线性空间中。
线性空间是某一类事物从量的方面的一个抽象。我们认识客观事物,固然要弄清它们单个的和总体的性质,但更重要的是研究它们之间的各种各样的联系。在线性空间中,事物之间的联系就反映为线性空间的映射。线性空间 V V V 到自身的映射通常称为 V V V 的一个变换。其中最简单的一种变换就是线性变换,即保持线性运算的变换:
{ Γ ( α + β ) = Γ ( a ) + Γ ( b ) Γ ( k α ) = k Γ ( α ) ( 8 ) \begin{cases} \Gamma(\alpha+\beta)=\Gamma(a)+\Gamma(b)\\ \Gamma(k\alpha)=k\Gamma(\alpha) \end{cases}(8) {Γ(α+β)=Γ(a)+Γ(b)Γ(kα)=kΓ(α)(8)
譬如在几何空间中,关于平面 Π \Pi Π 的投影就是一个线性变换。这是因为,若向量 α \alpha α 的投影是 α ′ \alpha' α′,向量 β \beta β 的投影是 β ’ \beta’ β’,则易看出 α + β \alpha+\beta α+β 的投影是 α ′ + β ′ \alpha'+ \beta' α′+β′。这表明投影是保持向量加法的。同样,容易看出 k α k\alpha kα 的投影是 k α ′ k\alpha' kα′,这表明投影是保持数量乘法的。
线性变换是线性代数的重要研究对象。线性变换与矩阵有着非常密切的联系,在线性空间中若取定一组基,则一个线性变换可以对应到一个矩阵,这个对应是一一对应,并且这个对应是保持运算的。因此矩阵的好些问题可以通过研究线性变换来得到解决,而线性变换的好些问题又可以利用矩阵的工具来解决,它们互相渗透,密切相连。
以上所述的 线性方程组、矩阵、二次型、线性空间和线性变换 就是线性代数研究的主要对象。由于电大“线性代数”这门课程的学时比较少,我们就不讲抽象的线性空间了,而讲具体的 n n n 维向量空间;也不讲线性变换的概念了,而把线性变换的主要问题用矩阵的语言来讲。在这里顺便指出,高等代数是包括线性代数和多项式理论这两部分内容的,而我们仅学习线性代数这部分内容。
二、学习线性代数的用处
由于线性代数研究的是具有加法和数量乘法这两种运算的集合,而具有这两种线性运算的对象是很多的,因此线性代数的内容有广泛的应用。
线性方程组是最简单的方程组,在数学的各个分支、物理以及工程技术实际问题中会大量遇到线性方程组。因此给了一个线性方程组,它有没有解?若有解,如何求解?这都是必须明确的问题,以便于我们在数学的各个分支以及实际工作中能正确而迅速地解决所遇到的线性方程组的问题。
矩阵是非常重要的数学工具,许多数学问题、实际问题都可以引出矩阵,并且可以通过对矩阵进行运算或变换得到解决。例如,在微分方程组中,要解微分方程组(9),其中 y 1 、 y 2 y_1、y_2 y1、y2 是未知函数。
{ d y 1 d x = y 1 + 4 y 2 d y 2 d x = y 1 + y ( 9 ) \begin{cases}\frac{dy_1}{dx}=y_1+4y_2\\ \frac{dy_2}{dx}=y_1+y\end{cases}(9) {dxdy1=y1+4y2dxdy2=y1+y(9)
式(9)右边的系数可以排成一个矩阵 A = [ 1 4 1 1 ] A=\begin{bmatrix}1&4\\ 1&1\end{bmatrix} A=[1141] 。如果记 d d x ( y 1 y 2 ) = ( d y 1 d x d y 2 d x ) \frac{d}{dx}\begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}\frac{dy_1}{dx}\\ \frac{dy_2}{dx}\end{pmatrix} dxd(y1y2)=(dxdy1dxdy2),则利用矩阵的乘法可以把式(9)写成(10)。 d d x ( y 1 y 2 ) = ( 1 4 1 1 ) ( y 1 y 2 ) ( 10 ) \frac{d}{dx}\begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}1&4\\ 1&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}(10) dxd(y1y2)=(1141)(y1y2)(10)
作未知函数的线性替换 { y 1 = t 11 z 1 + t 12 z 2 y 2 = t 21 z 1 + t 22 z 2 ( 11 ) \begin{cases}y_1=t_{11}z_1+t_{12}z_2\\ y_2=t_{21}z_1+t_{22}z_2\end{cases}(11) {y1=t11z1+t12z2y2=t21z1+t22z2(11)
式(11)也可以利用矩阵的乘法写成(12) ( y 1 y 2 ) = ( t 11 t 12 t 21 t 22 ) ( z 1 z 2 ) ( 12 ) \begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}t_{11}&t_{12}\\ t_{21}&t_{22}\end{pmatrix}\begin{pmatrix}z_1\\z_2\end{pmatrix}(12) (y1y2)=(t11t21t12t22)(z1z2)(12)
记 T = [ t 11 t 12 t 21 t 22 ] T=\begin{bmatrix}t_{11}&t_{12}\\ t_{21}&t_{22}\end{bmatrix} T=[t11t21t12t22],将式(12)代入式(10),得
d d x ( T ( z 1 z 2 ) ) = A T ( z 1 z 2 ) \frac{d}{dx}\Big(T\begin{pmatrix}z_1\\z_2\end{pmatrix}\Big)=AT\begin{pmatrix}z_1\\z_2\end{pmatrix} dxd(T(z1z2))=AT(z1z2)
即
T d d x ( z 1 z 2 ) = A T ( z 1 z 2 ) ( 13 ) T\frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=AT\begin{pmatrix}z_1\\z_2\end{pmatrix}(13) Tdxd(z1z2)=AT(z1z2)(13)
在式(13)两边左乘 T − 1 T^{-1} T−1 (T的逆矩阵),得
d d x ( z 1 z 2 ) = T − 1 A T ( z 1 z 2 ) ( 14 ) \frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=T^{-1}AT\begin{pmatrix}z_1\\z_2\end{pmatrix}(14) dxd(z1z2)=T−1AT(z1z2)(14)
如果能选择矩阵 T T T,使得 T − 1 A T T^{-1}AT T−1AT 称为对角矩阵 [ a 1 0 0 a 2 ] \begin{bmatrix}a_1&0\\ 0&a_{2}\end{bmatrix} [a100a2] ,那么式(14)变成
d d x ( z 1 z 2 ) = [ a 1 0 0 a 2 ] ( z 1 z 2 ) ( 15 ) \frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=\begin{bmatrix}a_1&0\\ 0&a_{2}\end{bmatrix}\begin{pmatrix}z_1\\z_2\end{pmatrix}(15) dxd(z1z2)=[a100a2](z1z2)(15)
利用矩阵的乘法,式(15)就成为
{ d z 1 d x = a 1 z 1 d z 2 d x = a 2 z 2 ( 16 ) \begin{cases}\frac{dz_1}{dx}=a_1z_1\\ \frac{dz_2}{dx}=a_2z_2\end{cases}(16) {dxdz1=a1z1dxdz2=a2z2(16)
显然,微分方程组(16)是很容易求解的。这个例子说明,通过矩阵的运算和矩阵的变换,可以把一个复杂的问题变成一个较简单的问题,所以矩阵是一个很有用的工具。(博主:对于线性代数和微分方程之间的联系,可参考博主在2020年5月21日写的一篇文章《线代[6]|矩阵对角化以及特征值在微分方程中的应用》。2025.2.22 21:06)
二次型理论首先的一个应用是解决了二次曲线,特别是二次曲面的分类问题。其次,系数是实数的二次型的正定、负定、不定性被用在数学分析中解决多元函数的极大值、极小值问题。二次型理论在概率论与数理统计以及物理力学中也有重要应用。
值得指出的是,我们学习线性代数,除了线性代数的内容有广泛的应用以外,还在于线性代数这门学科考虑问题、解决问题的思想方法对我们有很大的帮助。譬如,代数学总是要对所研究的对象进行分类,在每类中取一个最简单的对象作为代表来进行研究。关于这点,举一个例子,对于两个 n n n 阶矩阵(n 行 n 列的矩阵) A A A、 B B B,如果存在一个可逆矩阵 T T T,使得
B = T − 1 A T B=T^{-1}AT B=T−1AT
则 A 、 B A、B A、B 称为相似。按照这个相似关系,全体 n 阶矩阵就被分成好多类,每一类里的矩阵是彼此相似的。有人会问:在每一类里能否找到一个最简单的矩阵作为代表?上面提到的微分方程组的例子中,关于选择 T T T,使得 T − 1 A T T^{-1}AT T−1AT 成为对角矩阵,就是这里所说的问题。这个问题在第五章矩阵的标准形中将得到解决。代数学的上述这种研究问题的方法对我们解决其他数学分支中的问题以至于实际中的一些问题都是可取的。又譬如在代数学里,经常要在一类对象里找出具有某一特定性质的特殊对象,举一个例子:什么样的 n n n 阶矩阵是可逆矩阵?在解决这种问题时,总是先考虑如果矩阵 A A A 是可逆矩阵,那么它将具有哪些性质,然后再考虑具有这些性质的矩阵是否一定是可逆矩阵。这种考虑问题的方法是:先缩小范围,然后在这缩小了的范围内来审查这些对象是否都是具有某一特定性质的对象。这种考虑问题的方法也是可取的。像这种在学习一门课程的时候,除了学习这门课程的内容外,还注意学习这门学科考虑问题的一些方法也是很有必要的。这样我们学到的就不仅是一些现成的结论,而且有考虑问题、解决问题的一些方法。
三、线性代数的特点
代数学研究问题的基本方法是,先从某些具有公共性质的对象抽象出它们最基本的几条性质作为定义,然后从这些定义出发进行逻辑推理,揭示出这类对象的新的性质。譬如线性空间这一概念就是这样抽象出来的:把具有加法和数量乘法这两种运算,并且满足八条规律作为线性空间的定义,然后从线性空间的定义出发进行逻辑推理,揭示出线性空间的许多性质,这些性质由于是只用到线性空间的定义进行逻辑推理得到的,并没有用到线性空间里的元素的具体特性,因此这样推导出来的性质就对所有的线性空间都适用,不管是几何空间、 n 维向量空间、还是矩阵组成的空间、连续函数组成的空间,都具有这些性质。可见,这种方法的好处在于它能使应用非常广泛。 代数学的这种研究问题的方法称为公理化的方法或抽象的方法,这种公理化的方法使得线性代数具有如下几个特点:
第一,概念多而且抽象。 警如在第三章线性方程组中,将遇到向量组的线性相关、线性无关,等价的向量组,向量组的极大无关组,向量组的秩,矩阵的秩等一系列概念,而且这些概念都比较抽象。概念上的高度抽象性是近代数学的特点之一。由此而来的则是应用上的极其广泛性,这也是近代数学的一个特点。在线性代多中,由线性方程组抽象出 n n n 维向量和矩阵这两个概念,又从 n n n 维向量空间抽象出线性空间的概念,一次比一次抽象。抽象的东西不如具体的东西好学,但是抽象的东西比具体的东西应用要广,所以还是需要认真下功夫把它学好。
第二,逻辑性强。 由于代数学的基本方法是由具体事务抽象出一般概念,再运用这些概念逻辑推理揭示出事物新的性质,因此线性代数这门课程的逻辑性强,一环扣一环。
第三,明显的几何背景。 这在前面介绍线性代数的内容时已多次提到。这个特点使我们在学习线性代数里的抽象的概念时,可以借助几何直观来帮助我们理解这些概念,应该充分利用这一特点。
四、学习线性代数的方法
根据线性代数的上述特点,我们在学习线性代数时应当注意以下几方面。
第一,要把概念弄清楚,理解确切并且记住。 如果概念不清楚,模模糊糊,那就没有办法运用概念去进行逻辑推理,做题时就不知道如何下手。因此在学习中,应当首先复习概念、定理,弄明白了,然后再开始做作业。表面上看起来,似乎比一开始就做作业要慢,实际上,先复习概念、定理、例题,然后再做作业,可以使作业做得比较顺利,反倒省时间。更何况,我们如果没有弄清楚概念,那么只会做跟例题差不多的题,稍灵活一些,变换一下题目,就不会做了。所以希望同学们务必先复习概念、定理、例题,然后再做作业。由于线性代数逻辑性强,后面的内容需要用到前面的好些概念、定理,如果每次课,没有及时复习、消化,那么时间越长,学的概念、定理越多,脑子里就会堆积着一大堆模模糊糊的东西,这样学起后面的内容就很吃力。而如果每次课后,都能及时复习、及时消化,就会越学越顺利,那么怎样才能把概念弄清楚呢?一般来说应当从以下几方面着手:
- 【1】先要弄清楚这个概念是怎样提出来的?它的背景是什么?
- 【2】这个概念的确切内容是什么?
- 【3】多举一些具体的例子来帮助理解抽象的概念,特别是举一些几何上的例子,比较直观、形象。
譬如,向量组线性相关、线性无关这个概念,它是怎么提出来的呢?为什么要学习这个概念呢?这是因为我们要研究线性方程组什么时候有解。由于每个线性方程可用一个向量表示,于是线性方程组是否有解必然跟表示这些方程的一组向量是怎么样的向量组有关系。
从几何上看,两个向量 α 、 b \alpha、b α、b 组成的向量组有两种可能,即 α \alpha α 与 b b b 共线,或者 α \alpha α 与 b b b 不共线。前一情形, α \alpha α 与 b b b 在一条直线上,我们称向量组 α 、 b \alpha、b α、b 线性相关;后一情形, α \alpha α 与 b b b 不在一条直线上,我们称 α \alpha α 与 b b b 组成的向量组线性无关。为了能把线性相关、线性无关的概念推广到 n 维向量空间中,需要对几何上的向量 α \alpha α 与 b b b 共线在代数上如何表示加以分析。在解析几何里知道, α \alpha α 与 b b b 共线的充分必要条件是其中一个向量是另一个向量的倍数,即 α = n b \alpha= nb α=nb 或者 b = μ α b=\mu\alpha b=μα ,其中 n、m 是实数,也就是 1 ⋅ α − λ b = 0 1\cdot\alpha-\lambda b=0 1⋅α−λb=0 或者 μ α − 1 ⋅ b = 0 \mu\alpha-1 \cdot b=0 μα−1⋅b=0 。换言之,存在不全为 0 的数 k 1 、 k 2 k1、k2 k1、k2 ,使得 k α + k b = 0 k\alpha+kb=0 kα+kb=0 。从这几何背景引出向量组线性相关的定义:对于向量组 a 1 , a 2 , ⋯ , a s ( s ≥ 1 ) a_1,a_2,\cdots,a_s(s \geq 1) a1,a2,⋯,as(s≥1),如果存在一组不全为 0 的数 k 1 , k 2 , ⋯ , k s k_1,k_2,\cdots,k_s k1,k2,⋯,ks,使得式(17)成立,则称向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 1 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s \geq 1) α1,α2,⋯,αs(s≥1) 线性相关。
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 ( 17 ) k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=0(17) k1α1+k2α2+⋯+ksαs=0(17)
在理解这个定义时,要注意“不全为 0”这几个字。因为对于任何向量组 a 1 , a 2 , ⋯ , a s a_1,a_2,\cdots,a_s a1,a2,⋯,as 来说,都有
0 ⋅ α 1 + 0 ⋅ α 2 + ⋯ + 0 ⋅ α s = 0 0\cdot\alpha_1+0\cdot\alpha_2+\cdots+0\cdot\alpha_s=0 0⋅α1+0⋅α2+⋯+0⋅αs=0
所以如果在线性相关的定义中不添加上“不全为 0”的限制,那么就毫无意义了。何况从几何背景上我们知道 α \alpha α 与 b b b 共线的充分必要条件是存在不全为 0 的数 k 1 , k 2 , ⋯ , k s k_1,k_2,\cdots,k_s k1,k2,⋯,ks 使得 k α + k b = 0 k\alpha+kb=0 kα+kb=0,所以只有当向量组 a 1 , a 2 , ⋯ , a s a_1,a_2,\cdots,a_s a1,a2,⋯,as 存在不全为 0 的数 k 1 , k 2 , ⋯ , k s k_1,k_2,\cdots,k_s k1,k2,⋯,ks 使得式(17)成立时,才是线性相关。
一个向量组不线性相关就称这个向量组线性无关。例如,几何上两个向量a与b若不共线,就称向量组 a、b 线性无关。既然向量组 a 1 , a 2 , ⋯ , a s a_1,a_2,\cdots,a_s a1,a2,⋯,as 不线性相关,就称为线性无关,因此向量组线性无关的定义又可叙述如下:
对于向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs,如果从 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 ( 17 ) k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=0(17) k1α1+k2α2+⋯+ksαs=0(17) 可以推出 k 1 = k 2 = ⋯ = k s = 0 k_1=k_2=\cdots=k_s=0 k1=k2=⋯=ks=0,则称向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs 线性无关。这就是说,对于向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs,如果只有一组全为 0 的数,使得式(17)成立,则称向量组 α 1 , α 2 , ⋯ , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,⋯,αs 线性无关。
为了更好地把握向量线性无关的定义,我们在学习中,还应该多通过一些具体的例子去深入体会。(博主:对于以上文本中涉及到的一切数学概念的梳理,可阅读博主于2020年4月23日发布的一篇文章《线代[2]|对极易混淆概念的梳理:线性相关与线性无关、极大线性无关部分组与秩与基础解系、向量空间的基与维数》。2025.2.22 21:15)
第二,要努力培养逻辑推理的能力,即运用概念和已知的定理、性质进行推理、判断的能力。 为此,形式逻辑的一些基本常识是应当熟悉的。譬如,命题有四种形式: 原命题、逆命题、否命题、逆否命题。若原命题正确,则逆否命题一定正确,但是逆命题和否命题不一定正确。
要能进行逻辑推理,就必须熟记概念和定理、性质,否则就没有武器,遇到一个题就不知道如何下手。
第三,学习每一章、每一节时,都要明确这章、这节要研究什么问题,是如何解决的。 这样做,学习中头脑就是清醒的;如果不这样做,就会稀里糊涂,不知道现在在干什么。在学习一个定理时也要这样,要明确为什么要有这个定理,这个定理是如何证明的,主要是抓住证明的思路,弄清是怎样去证明的。如果坚持这么做了,就能不断学到一些方法,从而提高分析问题、解决问题的能力。
第四,学习线性代数跟学习任何一门数学课一样,必须适当多做一些习题。 光听课、光看书,自己不动手做题,那是学不好数学的。只有通过做题,才能加深对概念、定理的理解,才能学到一些方法。做习题时,一定要自己动脑子想,不要轻易翻习题解答,只有当想了很久确实想不出来时,才翻一下习题解答,稍微看一两眼,得到一点提示就可以不看了,自己再去想。只有自己动脑子做出来的题才是真的会了,如果是自己动脑子不够,轻易就看习题解答,那么很快就会忘的。做完题要注意小结,看看这样一类问题应当如何下手,千万不要任务观点,赶紧做完作业就放到一边。应当想一想,通过做这几个题有什么收获,学到什么方法。这样日积月累,能力就逐渐提高了。还要指出一点,做计算题时要算到底,不要因为算起来较麻烦就不愿意往下算了认为反正我方法会了。这样下去是不行的。其实算得对、算得快,这也是需要培养的一种能力,不在平时做作业时训练,就会在今后实际工作中算题时尽出错。
线性代数概念较多,也比较抽象一点,但是只要我们下决心,并且注意学习方法,是能够学好的。
五、更新时间记录
- 收录第一节内容至“旋转矩阵”;「2025.2.15 13:54」
- 第一节“线性代数的内容简介”收录完毕;「2025.2.15 20:07」
- 第二节收录“”至代数式(12);「2025.2.15 20:26」
- 第二节“学习线性代数的用处”收录完毕;「2025.2.16 11:32」
- 第三节“线性代数的特点”收录完毕;「2025.2.16 11:32」
- 第四节收录至线性相关部分(这些数学符号手打太累人了!!!);「2025.2.16 12:04」
- 第四节“学习线性代数的方法”收录完毕;「2025.2.16 13:34」
- 额外增加“向量空间的十条公理”;「2025.2.22 20:57」
- 在原文中增加了两篇博主几年前写的线代文章链接;「2025.2.22 21:15」
- 在文章开头增加“说明”一节。「2025.2.22 21:41」
P.S.1 四年多了,四年多了,在2020年6月1日写下线性代数专栏的第7篇文章《线代[7]|实对称矩阵》后,我终于又敲录了第8篇!「2025.2.22 21:45」
P.S.2 现在这个时代也许光从课本的内容出发学习线性代数就有点单薄了,线性代数是许多高阶数学与物理课的基础,同时在游戏开发,统计,R编程,Python编程,人工智能大模型等领域有极其重要的应用。但这些涉及专业的领域,我个人已无能为力……「2025.2.22 21:52」
相关文章:
线代[8]|北大丘维声教授《怎样学习线性代数?》(红色字体为博主注释)
文章目录 说明一、线性代数的内容简介二、学习线性代数的用处三、线性代数的特点四、学习线性代数的方法五、更新时间记录 说明 文章中红色字体为博主敲录完丘教授这篇文章后所加,刷到这篇文章的读者在首次阅读应当跳过红色字体,先通读一读文章全文&…...

使用 C++ 和 gRPC 的常见陷阱及解决方案
文章目录 1. 环境配置的陷阱1.1 依赖版本冲突或混淆1.2 gRPC 工具缺失 2. 编译和链接的陷阱2.1 运行时库不匹配(/MT vs /MD)2.2 未解析的外部符号 3. Protobuf 文件生成的陷阱3.1 工具版本不匹配3.2 生成文件运行时库不一致 4. 运行时的陷阱4.1 缺少 DLL…...

《深度学习实战》第2集:卷积神经网络(CNN)与图像分类
《深度学习实战》第2集:卷积神经网络(CNN)与图像分类 引言 卷积神经网络(Convolutional Neural Network, CNN)是深度学习在计算机视觉领域的核心工具。从早期的 LeNet 到现代的 ResNet 和 Vision Transformer…...

AD(Altium Designer)器件封装——立创商城导出原理图和PCB完成器件封装操作指南
目录 1、立创商城下载原理图和PCB图 1.1 打开立创商城 1.2 寻找所需器件 1.3 确定所需芯片 1.4 打开原理图和PCB图 1.5 导出原理图 1.6 确定导出为AD文件 1.7 下载成功 1.8 导出PCB 1.9 确定导出为AD文件 1.10 原理图PCB下载成功 2、原理图和PCB图预处理 2.1 复制…...
DeepSeek掘金——调用DeepSeek API接口 实现智能数据挖掘与分析
调用DeepSeek API接口:实现智能数据挖掘与分析 在当今数据驱动的时代,企业和开发者越来越依赖高效的数据挖掘与分析工具来获取有价值的洞察。DeepSeek作为一款先进的智能数据挖掘平台,提供了强大的API接口,帮助用户轻松集成其功能到自己的应用中。本文将详细介绍如何调用D…...

LangChain系列:精通LangChain的合并文档链
LangChain的合并链旨在解决语言模型处理长文本时的上下文限制问题,包含Stuff、MapReduce、Refine和Rerank四种策略。Stuff链通过简单拼接文档块实现快速处理,适用于短文本但受限于模型token容量;MapReduce链采用分治思想,先独立处…...
rtcwake - Linux下定时唤醒计算机
rtcwake 是一个用于通过实时时钟(RTC)唤醒计算机的工具。它常用于在 Linux 系统中设置计算机在指定时间自动唤醒或关闭。以下是对命令 rtcwake -m off -s ${sleep_time} 的详细解析: 命令解析 bash复制 rtcwake -m off -s ${sleep_time} 1…...

MATLAB在投资组合优化中的应用:从基础理论到实践
引言 投资组合优化是现代金融理论中的核心问题之一,旨在通过合理配置资产,实现风险与收益的最佳平衡。MATLAB凭借其强大的数学计算能力和丰富的金融工具箱,成为投资组合优化的理想工具。本文将详细介绍如何使用MATLAB进行投资组合优化&#…...
什么是“可迭代”
在 Python 中,“可迭代”(Iterable)是一个非常重要的概念,它指的是任何可以被逐个访问其元素的对象。换句话说,如果一个对象支持迭代操作(比如可以通过 for 循环逐个访问其元素),那么…...
Python天梯赛10分题-念数字、求整数段和、比较大小、计算阶乘和
007-念数字 输入一个整数,输出每个数字对应的拼音。当整数为负数时,先输出fu字。十个数字对应的拼音如下: 0: ling 1: yi 2: er 3: san 4: si 5: wu 6: liu 7: qi 8: ba 9: jiu输入格式: 输入在一行中给出一个整数,如&…...
C#初级教程(6)——函数:从基础到实践
一、函数的核心价值:简化与复用代码 以游戏开发项目为例,在游戏中,角色的移动、攻击等行为并非只在单一场景中出现。设想一下,若每次需要角色执行这些行为时,都要重新编写对应的代码,那将是何等繁琐且易错的…...
【Bluedroid】AVRCP 连接源码分析(一)
一、AVRCP协议简介 AVRCP(Audio/Video Remote Control Profile)是蓝牙协议栈中的一个重要部分,它定义了蓝牙设备之间的音视频传输控制的流程和特点。AVRCP使得用户可以通过一个蓝牙设备(如手机)远程控制另一个蓝牙设备(如蓝牙耳机或音箱)上的音视频播放,如播放、暂停、…...

编程考古-忘掉它,Delphi 8 for the Microsoft .NET Framework
忘掉它吧,作一篇记录! 【圣何塞,加利福尼亚 – 2003年11月3日】在今日的Borland开发者大会上,Borland正式推出了Delphi 8 for Microsoft .NET Framework。这款新版本旨在为Delphi开发者提供一个无缝迁移路径,将现有的…...

Linux-Ansible基础模块
文章目录 模块Command模块Shell模块Script模块 🏡作者主页:点击! 🤖Linux专栏:点击! ⏰️创作时间:2025年02月22日19点21分 模块 Command模块 Command模块实践 ansible 192.168.1.100 -m com…...

正则表达式–断言
原文地址:正则表达式–断言 – 无敌牛 欢迎参观我的个人博客:正则表达式特殊字符 – 无敌牛 断言assertions 1、(?...):正向预查(positive lookahead),表示某个字符串后面应该跟着什么。但这个字符串本身…...

Swiper插件的运用和学习
Swiper中文网-轮播图幻灯片js插件,H5页面前端开发 Swiper 是目前最流行的免费开源轮播组件之一,它功能强大、高度可定制且兼容性好,支持移动端手势操作和丰富的交互动画。 下载Swiper压缩包 轮播图演示页面。可以看见各种不同切换效果的轮播图 然后解压…...
标准I/O与文件I/O
一、概念 标准IO:标准IO是指程序与标准输入(stdin)、标准输出(stdout)和标准错误(stderr)之间的输入输出操作。通常用于与用户交互或输出调试信息。文件IO:文件IO是指程序与文件系统…...
JavaScript函数-函数的参数
在JavaScript编程语言中,函数是组织代码和实现复杂逻辑的基本单元。而函数参数则是这些功能的重要组成部分,它们允许我们将数据传递给函数,从而使得函数更加通用和灵活。本文将深入探讨JavaScript函数参数的各种特性及其最佳实践。 参数基础…...

Android TabLayout 实现随意控制item之间的间距
效果 红色标注是不同的间距。 实现方式 1、xml中定义 <com.google.android.material.tabs.TabLayoutandroid:id"id/tab_layout"android:layout_width"wrap_content"app:tabIndicatorColor"color/color_FF00B2E3"app:tabBackground"a…...

STM32的“Unique device ID“能否修改?
STM32F1系列的"Unique device ID"寄存器的地址为0x1FFFF7E8。 这个寄存器是只读的。 "Unique device ID"寄存器位于“System memory”中。“System memory”地址范围为“0x1FFF F000- 0x1FFF F7FF”。 所有STM32 MCU上都存在系统引导加载程序。顾名思义&a…...

循环冗余码校验CRC码 算法步骤+详细实例计算
通信过程:(白话解释) 我们将原始待发送的消息称为 M M M,依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)(意思就是 G ( x ) G(x) G(x) 是已知的)࿰…...
Java如何权衡是使用无序的数组还是有序的数组
在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...
掌握 HTTP 请求:理解 cURL GET 语法
cURL 是一个强大的命令行工具,用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中,cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。 一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...
pycharm 设置环境出错
pycharm 设置环境出错 pycharm 新建项目,设置虚拟环境,出错 pycharm 出错 Cannot open Local Failed to start [powershell.exe, -NoExit, -ExecutionPolicy, Bypass, -File, C:\Program Files\JetBrains\PyCharm 2024.1.3\plugins\terminal\shell-int…...

使用ch340继电器完成随机断电测试
前言 如图所示是市面上常见的OTA压测继电器,通过ch340串口模块完成对继电器的分路控制,这里我编写了一个脚本方便对4路继电器的控制,可以设置开启时间,关闭时间,复位等功能 软件界面 在设备管理器查看串口号后&…...
Spring Boot 与 Kafka 的深度集成实践(二)
3. 生产者实现 3.1 生产者配置 在 Spring Boot 项目中,配置 Kafka 生产者主要是配置生产者工厂(ProducerFactory)和 KafkaTemplate 。生产者工厂负责创建 Kafka 生产者实例,而 KafkaTemplate 则是用于发送消息的核心组件&#x…...

【Ragflow】26.RagflowPlus(v0.4.0):完善解析逻辑/文档撰写模式全新升级
概述 在历经半个月的间歇性开发后,RagflowPlus再次迎来一轮升级,正式发布v0.4.0。 开源地址:https://github.com/zstar1003/ragflow-plus 更新方法 下载仓库最新代码: git clone https://github.com/zstar1003/ragflow-plus.…...

Linux 内核内存管理子系统全面解析与体系构建
一、前言: 为什么内存管理是核心知识 内存管理是 Linux 内核最核心也最复杂的子系统之一,其作用包括: 为软件提供独立的虚拟内存空间,实现安全隔离分配/回收物理内存资源,维持系统稳定支持不同类型的内存分配器,最优…...
JVM内存区域与溢出异常详解
当然可以。以下是结合了程序计数器和Java内存区域以及内存溢出异常的详细解释: JVM内存区域与内存溢出异常 Java虚拟机(JVM)管理着不同类型的内存区域,每个区域都有其特定的功能和可能导致的内存溢出异常。 程序计数器ÿ…...