![矩阵理论与方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/490/773490/b_773490.jpg)
1.3 线性变换
本节主要研究线性空间中元素之间的关系,介绍映射、线性变换的概念、线性变换的矩阵表示及其有关子空间。
1.3.1 线性变换的概念及实例
若不特别提出,下面所考虑的都是固定在某一数域F上的线性空间。
定义1.3.1 设V1,V2是两个线性空间,若对于某个指定的法则T,使V1中任意一元素α都能与V2中的一个确定元素β相对应,则T称为由V1到V2的一个映射,记为
β=T(α)
β称为α在映射T下的像,而α称为β的原像。
若T同时还满足:
对任意的α1,α2∈V有
T(α1+α2)=T(α1)+T(α2)
及对任意k∈F,α∈V,有
T(kα)=kT(α)
则称T为从V1到V2的一个线性映射。
定义1.3.2 若T为线性空间V到自身的一个映射,则T称为V的一个变换。若变换T对于V中任意的元素α、β和数域F中的任意数k,还同时满足
T(α+β)=T(α)+T(β)
T(kα)=kT(α)
则称T为线性空间V的一个线性变换。
我们可以把定义1.3.2中两个条件用一个表达式来表示,即T是V的线性变换的充分必要条件是
T(kα+lβ)=kT(α)+lT(β)
其中,α与β是V中任意向量,k与l是数域F中任意数。
以后一般用白斜体拉丁字母A,B,C,…,T,…代表线性空间V的线性变换,T(α)或Tα代表元素α在线性变换T下的像。
线性变换的丰富内容可从下面的几个例子显示出来。
【例1.3.1】 设R4×4是实数域R上全体4阶方阵的集合,A为R4×4中任意一个4阶方阵
T(A)=|A|
表示T是R4×4到R的一个映射。
【例1.3.2】 在平面几何空间R2中,把任一向量x=(x1,x2)T在平面上绕原点按逆时针方向旋转θ角后,得到向量y=(y1,y2)T。它们之间的关系用以下公式表示:
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0023_0001.jpg?sign=1739260862-hqq56J47tJwb8FjIwCfILnoyVXLDdMLS-0-d937e6a7f7ae77df40c6fc6d2c3a9825)
即
y=T(x)
根据定义,易说明T是R2的线性变换。
【例1.3.3】 关于F[x]n的求导变换D。对任意f(x)∈F[x]n有D[f(x)]=f′(x),则求导变换D是F[x]n上的一个线性变换。
【例1.3.4】 设C[a,b]表示定义在闭区间[a,b]上全体实连续函数组成的实数域上的线性空间。在C[a,b]中,变换
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0023_0002.jpg?sign=1739260862-b6wmFcxTa4FzDL0NeMS0QBc6aoHhqNrw-0-240078567c0ccfea667df4ca275dc2ca)
其中,f(t)是C[a,b]中任意实连续函数。
用定义不难验证积分变换∫是C[a,b]上的一个线性变换。
【例1.3.5】 在线性空间V中,
(1)把V中的任意向量α变成α的变换,称为V的恒等变换或单位变换,记做I,即
I(α)=α
(2)把V中的任意向量α变成零向量的变换,称为V的零变换,记做T0,即
T0(α)=0
(3)设k是F中的某个数,把V中任意向量α变成kα的变换,称为V的数乘变换,记做K,即
K(α)=kα
当k=1时,得到单位变换I;当k=0时,得到零变换T0。
易证明单位变换、零变换和数乘变换都是线性变换。
线性变换有如下简单性质:
若T是V的线性变换,则
(1)T(0)=0, T(-α)=-T(α)。
(2)若β=k1α1+k2α2+…+kmαm,则有
T(β)=k1T(α1)+k2T(α2)+…+kmT(αm)
又若k1α1+k2α2+…+kmαm=0,则有
k1T(α1)+k2T(α2)+…+kmT(αm)=0
其中,β,αi∈V,ki∈F(i=1,2,…,m)。上式表明,线性变换保持线性关系式不变。
(3)若α1,α2,…,αm∈V,且α1,α2,…,αm线性相关,则T(α1),T(α2),…,T(αm)也线性相关。即线性变换把线性相关的向量组变成线性相关的向量组。
要注意的是,线性变换可能把线性无关的向量组变成线性相关的向量组。
1.3.2 线性变换的运算
定义1.3.3 设线性变换T1、T2和T都是线性空间V的线性变换,k∈F,若
(1)对任意向量α∈V,均有T1(α)=T2(α),则称T1与T2相等,记为T1=T2;
(2)对任意向量α∈V,均有T1(α)+T2(α)=T(α),则称T为T1与T2的和,记为T=T1+T2;
(3)对任意向量α∈V,任意k∈F,均有T(α)=k(T1(α)),则T为T1与k的乘积,记为T=kT1;
(4)若对任意向量α∈V,有(-T)(α)=-T(α),则(-T)为T的负变换;
(5)对于任意向量α∈V,均有T(α)=T1(T2(α)),则称T为T1与T2的积,记为T=T1T2;
(6)设T1是V的线性变换,若在V中有线性变换T2存在,使对于任意向量α∈V,有
T1T2(α)=T2T1(α)=I(α)
这时,线性变换T1称为可逆的。T2称为T1的逆变换,记为,且逆变换是唯一的。
要注意的是,一般情况下线性变换的乘积不满足交换律,即T1T2≠T2T1。对线性变换的运算,通过验证易得到如下结论:
线性变换的和、数乘、积、逆变换与负变换都仍是线性变换。
这里要指出的是,定义1.3.3所提到的线性变换的加法和数乘具有以下性质:
线性变换的加法满足:
(1)T1+T2=T2+T1;
(2)(T1+T2)+T3=T1+(T2+T3);
(3)T+T0=T;
(4)T+(-T)=T0。
线性变换的数乘满足:
(1)1·T=T;
(2)k(lT)=(kl)T;
(3)(k+l)T=kT+lT。
其中T1、T2、T3、T0、T、(-T)都是数域F上线性空间V的线性变换,k、l是F中任意的数。
由线性变换的加法与数乘定义及其性质,看出线性空间中所有线性变换所构成的集合,在规定的运算下构成V的一个新线性子空间。
1.3.3 线性变换的矩阵表示
由于线性变换的概念比较抽象,为了研究方便,现来建立线性变换与矩阵的联系。
首先说明,当数域F上n维线性空间V取定一组基α1,α2,…,αn后,V中的一个线性变换T可与Fn×n中的矩阵A有一个一一对应的关系,可形式地表示为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0001.jpg?sign=1739260862-v2XHcZkfuLQKLpuKvHn6benPkkKeU50D-0-bdc6e843330cbdcf3eed58e4015c9249)
事实上,由线性变换T唯一地确定了基的像T(α1),T(α2),…,T(αn),所以它们在给定基下都有确定的坐标。以T(αj)在给定基下的坐标作为矩阵A的第j列,这就构造了唯一确定的一个n阶方阵A。
反之,取定Fn×n中一个矩阵A,则A的n个列唯一确定n个向量β1,β2,…,βn分别作为α1,α2,…,αn的像,就可唯一确定V的一个线性变换T,其中βj关于基α1,α2,…,αn的坐标是A的第j列元素。
下面给出线性变换矩阵表示的定义。
定义1.3.4 设T是n维线性空间V的一个线性变换,α1,α2,…,αn是V的一个基,设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0002.jpg?sign=1739260862-V6iLrbP4eKYFurzJD3PpNpbhfqhiTfoy-0-0b8b3103dd76a5baafe0654aa9d37c9b)
用矩阵形式表示为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0003.jpg?sign=1739260862-UAKWw7Z7EqXNY6nQr6rHyJX2T9zsAby4-0-81e3b84d367e66a49cca1737d8327fb8)
其中
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0004.jpg?sign=1739260862-PTmkNvBRIpaoAHuuztp7LHfXakFHL9AH-0-369760b06fb4566b2e82f5ec65aa213b)
称A为线性变换T在基α1,α2,…,αn下的矩阵。
显然,线性空间V中的零变换、单位变换、数乘变换在任意一个基下的矩阵分别为零矩阵、单位矩阵和数量矩阵。
【例1.3.6】 求F[x]n的求导变换D,在基1,x,x2,…,xn-1下的矩阵。
解 因为
D(1)=0,D(x)=1,D(x2)=2x,…,D(xn-1)=(n-1)xn-2
所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0005.jpg?sign=1739260862-9CYS4CuEDFdeFDSYYKb6jguQ9kL645E2-0-e95fc5a5527769ad93bc756323580492)
所求矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0001.jpg?sign=1739260862-JjABuEonfowljBTVhGbEYcetr2iZvD8e-0-f85dd0fa1589308a1149faeed60acbbd)
在取定一组基后,线性变换与n阶矩阵是一一对应关系,它可以保持运算。
定理1.3.1 若α1,α2,…,αn是n维线性空间V的一个基,则在这组基下,每个线性变换按式(1.3.1)都可对应一个n阶方阵,这个对应有以下性质:
(1)线性变换的和对应矩阵的和;
(2)线性变换的乘积对应矩阵的乘积;
(3)线性变换与数的乘积对应矩阵与数的乘积;
(4)可逆的线性变换与可逆矩阵对应,且逆变换对应于逆矩阵。
证略。
利用线性变换的矩阵可以求出一个向量的像。
定理1.3.2 设线性变换T在基α1,α2,…,αn下的矩阵是A,向量α及其像T(α)在基α1,α2,…,αn下的坐标分别是(x1,x2,…,xn)T与(y1,y2,…,yn)T,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0002.jpg?sign=1739260862-xUnszU0gU5ku5wga3QXxLNfiSnpWhk3K-0-a5fd79e467873101d389a7e83392e615)
证 已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0003.jpg?sign=1739260862-rJhNUekqRZAZwK3BsXhK3BTyvn06H2VR-0-69a97fc740fb901c83df3f2272ddeef8)
及
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0004.jpg?sign=1739260862-fEPbfGuHbc7J7qtsIq3ab9LGGXewgEZz-0-4702bc5e8148ef919d4be52e59e96fe8)
于是
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0005.jpg?sign=1739260862-F6jJX57F0YI3rFLG4ao2cKONrREECPdv-0-bec185ad835705b5deeea989c9a6e8e3)
将式(1.3.2)代入,有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0006.jpg?sign=1739260862-GsHVG37ZIoiR1rVNi0iWgfjeBTcFQjE8-0-3d56428cdcf7f1ed95e3ef555356247b)
又因为α1,α2,…,αn线性无关,所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0007.jpg?sign=1739260862-xWRZd1p8V664Z3S5irVFFhCASDtkjfqA-0-c92a3c8944bfcb3fca79c3ff2930e188)
下面的定理给出同一线性变换在不同基下的矩阵之间的关系,这对以后的讨论很重要。
定理1.3.3 设线性空间V中,线性变换T在基(1)α1,α2,…,αn与基(2)β1,β2,…,βn下的矩阵分别是A和B,由基(1)到基(2)的过渡矩阵是P,则有B=P-1AP。
证 已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0001.jpg?sign=1739260862-PDff6dQfNKj49Tr5yeD8VBu0qMtVpUuh-0-7c2ecda5303a7e6858ffaa3ffa9f517e)
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0002.jpg?sign=1739260862-sCYA4JyhqZm2qJtzoSACwNtFXVe4xmrI-0-34bdf44ae73a7a95cea41f39e350abda)
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0003.jpg?sign=1739260862-vKWJBIcJml8fh9lDwepgjxSEkAPoytho-0-774e5caece3abc943df0986fe021d336)
于是
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0004.jpg?sign=1739260862-YroRsqBjh3xxSt56FSBc4dGZ0SB56SFm-0-a489477242854db0f6f93739fed329de)
与式(1.3.4)比较,有
B=P-1AP
所以,同一线性变换在不同基下的矩阵是相似关系。
【例1.3.7】 已知R3中线性变换T在基β1=(-1,1,1)T,β2=(1,0,-1)T,β3=(0,1,1)T下的矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0005.jpg?sign=1739260862-RKVDspw2BxtH0f89v5YTeUe5ZfUJ6NFB-0-f2d7f672bca4155285a0d875a8ce8a2c)
求:(1)T在基α1=(1,0,0)T,α2=(0,1,0)T,α3=(0,0,1)T下的矩阵;
(2)向量η=(1,0,1)T及T(η)在β1,β2,β3下的坐标。
解(1)由
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0006.jpg?sign=1739260862-seE5kygsi27Pu04XXb1FuR8Zsy1s4sBv-0-f72281a768bf8c1b88ce21a50f788df1)
得到基α1,α2,α3到基β1,β2,β3的过渡矩阵P
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0007.jpg?sign=1739260862-cp07I7aaVp5IzLYrdh1cEC1RcAPkJJDc-0-93471d72ec2afb688ea801168ad63130)
又已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0008.jpg?sign=1739260862-igsPtyFRMiQgxnZvMQ3Us1YRAtLpkL7g-0-5e7f57dfdfa4361972ad943f1dad16be)
即线性变换T在基β1,β2,β3下的矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0009.jpg?sign=1739260862-9DILqFf5LrxxaGoYFfQlUpPpYiXfom5c-0-3b7a9d316db53ef1129d18b7daee719b)
设线性变换T在基α1,α2,α3下的矩阵为A,即
T(α1,α2,α3)=(α1,α2,α3)A
由定理1.3.3有B=P-1AP,求出
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0001.jpg?sign=1739260862-7ExfQgCfzTE0be0PQYVu1fDeq4NGsHs4-0-ba932e00139c531b5f42d0e71a3a2a5d)
所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0002.jpg?sign=1739260862-UTNJR2kUqjiQxWxOARRnyxeFX8fRpoBE-0-679134ae85845aeb6d665daac4ca94da)
A即为所求。
(2)设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0003.jpg?sign=1739260862-y4E9xo5ANIF7KWNhY0051jUXghDtxlkh-0-d97f546e3176ca69662912b414b95868)
解此非齐次线性方程组,得
x1=-2,x2=-1,x3=2
所以,η在基β1,β2,β3下的坐标为(-2,-1,2)T。
设T(η)在基β1,β2,β3下的坐标为(y1,y2,y3)T,可由定理1.3.2所给出的公式求出,即
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0004.jpg?sign=1739260862-ZDA1aib4uCSQOapvAYI6M1mZJZkOAVpD-0-1c330847c5d5e2379453287612b6edd8)
其中,B为线性变换T在基β1,β2,β3下的矩阵。由于B已在前面求出,所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0005.jpg?sign=1739260862-rMH510oLufraJf0o5jPgwQJEEtyGerGV-0-39dc7b28e69766a10bbff429ccd7562f)
*1.3.4 线性映射的矩阵表示
定义1.3.5 设T是由n维线性空间V1到m维线性空间V2的一个线性映射,α1,α2,…,αn与β1,β2,…,βm分别是V1与V2的一个基,则
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0006.jpg?sign=1739260862-3Zz4XnfSasXgTe8mceDI1Vs3BzevRSDB-0-6f450f35594c179bf0595d9ef4220fa8)
可形式地写成
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0007.jpg?sign=1739260862-oWL06a9NhgFrNhjyGmbKcovsCPmX5tEM-0-3ae7de7dcb53e5b784679a6829d44893)
设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0008.jpg?sign=1739260862-dx9RtMDo1zWqogDvBTKe8XpmS9wKhzzf-0-0e25d09786abad9e19abe62fe2585e0f)
上式可写成
T(α1,α2,…,αn)=(β1,β2,…,βm)A
我们称矩阵A为线性映射T在V1基α1,α2,…,αn与V2基β1,β2,…,βm下的矩阵。上式称为线性映射在一对基下的矩阵表示。
可以证明在V1与V2的一对基下,线性映射T与矩阵A之间是一一对应的。
定理1.3.4 设T是由n维线性空间V1到m维线性空间V2的线性映射,α1,α2,…,αn与β1,β2,…,βm分别是V1与V2的一个基,T在给定的一对基下的矩阵为A。若任意向量α∈V1,且Tα∈V2,在给定基下,它们的坐标分别为(x1,x2,…,xn)T和(y1,y2,…,ym)T,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0029_0001.jpg?sign=1739260862-Qfc9KsCUPrssZJZhQOYlWfGIgxTtOhrQ-0-ed86220c51107d6b4c242f8ead35626c)
此定理的证明与定理1.3.2的证明类似,留给读者自证。
定理1.3.4说明,有了线性映射在一对基下矩阵表示,就可以求出V1中向量α的坐标与它在V2中像的坐标之间的关系。
下面的定理将给出线性映射在不同对基下矩阵之间的关系。
定理1.3.5 设T是由n维线性空间V1到m维线性空间V2的一个线性映射,α1,α2,…,αn与α′1,α′2,…,α′n是V1的两个基,由αi到α′i(i=1,2,…,n)的过渡矩阵为P1。β1,β2,…,βm与β′1,β′2,…,β′m是V2的两个基,由βj到β′j(j=1,2,…,m)的过渡矩阵为P2。线性映射T在基α1,α2,…,αn与β1,β2,…,βm下的矩阵表示为A,在基α′1,α′2,…,α′n与β′1,β′2,…,β′m下的矩阵表示为B,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0029_0002.jpg?sign=1739260862-7PWN1ghImeisq64VhlycCB6R3ILMTzna-0-56e953e381a422e28259ecda9da494b2)
证略。由矩阵等价的定义知,矩阵A与矩阵B是等价的。
定理1.3.5说明,由n维线性空间V1到m维线性空间V2的一个线性映射T有一系列的m×n矩阵表示:A,B,…,它们之间的关系是等价关系。