矩阵是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。 [2]在物理学中,矩阵于电路学、力学、光学和量子物理中都有应用;计算机科学中,三维动画制作也需要用到矩阵。 矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,请参考《矩阵理论》。在天体物理、量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。
数值分析的主要分支致力于开发矩阵计算的有效算法,这是一个已持续几个世纪以来的课题,是一个不断扩大的研究领域。 矩阵分解方法简化了理论和实际的计算。 针对特定矩阵结构(如稀疏矩阵和近角矩阵)定制的算法在有限元方法和其他计算中加快了计算。 无限矩阵发生在行星理论和原子理论中。 无限矩阵的一个简单例子是代表一个函数的泰勒级数的导数算子的矩阵 [3]
- 中文名
- 矩阵
- 外文名
- Matrix
- 别 名
- 矩阵式、纵横阵
- 表达式
- Amn
- 提出者
- 凯利
- 提出时间
- 19世纪
在数学中,矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合 [1],最早来自于方程组的系数及常数所构成的方阵。这一概念由19世纪英国数学家凯利首先提出。作为解决线性方程的工具,矩阵也有不短的历史。成书最早在东汉前期的《九章算术》中,用分离系数法表示线性方程组,得到了其增广矩阵。在消元过程中,使用的把某行乘以某一非零实数、从某行中减去另一行等运算技巧,相当于矩阵的初等变换。但那时并没有现今理解的矩阵概念,虽然它与现有的矩阵形式上相同,但在当时只是作为线性方程组的标准表示与处理方式。
矩阵正式作为数学中的研究对象出现,则是在行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在实际的历史上则恰好相反。日本数学家关孝和(1683年)与微积分的发现者之一戈特弗里德·威廉·莱布尼茨(1693年)近乎同时地独立建立了行列式论。其后行列式作为解线性方程组的工具逐步发展。1750年,加布里尔·克拉默发现了克莱姆法则 [5]。
矩阵的概念在19世纪逐渐形成。1800年代,高斯和威廉·若尔当建立了高斯—若尔当消去法。1844年,德国数学家费迪南·艾森斯坦(F.Eisenstein)讨论了“变换”(矩阵)及其乘积。1850年,英国数学家詹姆斯·约瑟夫·西尔维斯特(James Joseph Sylvester)首先使用矩阵一词。
英国数学家阿瑟·凯利被公认为矩阵论的奠基人。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现了,这也使得凯利认为矩阵的引进是十分自然的。他说:“我决然不是通过四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文,研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯利还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是德国数学家弗罗贝尼乌斯(F.G.Frohenius)于1898年给出的 [5]。
1854年时法国数学家埃尔米特(C.Hermite)使用了“正交矩阵”这一术语,但他的正式定义直到1878年才由费罗贝尼乌斯发表。1879年,费罗贝尼乌斯引入矩阵秩的概念。至此,矩阵的体系基本上建立起来了。
无限维矩阵的研究始于1884年。庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具 [6]。
矩阵的概念最早在1922年见于中文。1922年,程廷熙在一篇介绍文章中将矩阵译为“纵横阵”。1925年,科学名词审查会算学名词审查组在《科学》第十卷第四期刊登的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今。
由 m × n 个数aij排成的m行n列的数表称为m行n列的矩阵,简称m × n矩阵。记作:
这m×n 个数称为矩阵A的元素,简称为元,数aij位于矩阵A的第i行第j列,称为矩阵A的(i,j)元,以数 aij为(i,j)元的矩阵可记为(aij)或(aij)m × n,m×n矩阵A也记作Amn。
矩阵的加法满足下列运算律(A,B,C都是同型矩阵):
应该注意的是只有同型矩阵之间才可以进行加法 [10]。
矩阵的数乘满足以下运算律:
矩阵的加减法和矩阵的数乘合称矩阵的线性运算 [7]。
把矩阵A的行和列互相交换所产生的矩阵称为A的转置矩阵( ) [8],这一过程称为矩阵的转置
矩阵的共轭定义为: .一个2×2复数矩阵的共轭(实部不变,虚部取负)如下所示 [11]:
则
矩阵的共轭转置定义为: ,也可以写为: 或者写为 。一个2×2复数矩阵的共轭转置如下所示:
主条目:矩阵乘法
两个矩阵的乘法仅当第一个矩阵A的列数和另一个矩阵B的行数相等时才能定义。如A是m×n矩阵和B是n×p矩阵,它们的乘积C是一个m×p矩阵 ,它的一个元素:
并将此乘积记为: [8].
例如:
矩阵的乘法满足以下运算律:
结合律:
左分配律:
右分配律:
主条目:行列式
一个n×n的正方矩阵A的行列式记为 或者 ,一个2×2矩阵的行列式可表示如下 [12]:
主条目:矩阵的迹
若 ,就称A为正定矩阵。若 则A是一个负定矩阵,若 ,则A为半正定矩阵,若A既非半正定,也非半负定,则A为不定矩阵 [15]。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数 [1]。
主条目:矩阵分解
设 ,则A可以唯一地分解为A=U1R ,其中U1是酉矩阵,R是正线上三角复矩阵,或A可以唯一地分解为其中L是正线上三角复矩阵,是酉矩阵 [11]。
设 ,若存在矩阵 及 ,使得A=FG,则称其为的A一个满秩分解 [18]。
LUP分解的思想就是找出三个n×n矩阵L,U,P,满足 。其中L是一个单位下三角矩阵,U是一个单位上三角矩阵,P是一个置换矩阵。 而满足分解条件的矩阵L,U,P称为矩阵A的一个LUP分解 [19]。
一个正方的复值矩阵 称为Hermitian矩阵,若A=AH即其元素 ,换言之Hermitian矩阵是一种复共轭对称矩阵 [1]。
对一个实值矩阵,Hermitian矩阵与对称矩阵等价。
一个实的正方矩阵 称为正交矩阵,若 。
一个复值正方矩阵 称为酉矩阵,若 。
矩阵 ,若矩阵满足条件aij=0,|i-j|>k,则矩阵A可以称为带型矩阵(banded matrix) [20]。
在线性代数中,三角矩阵是方形矩阵的一种,因其非零系数的排列呈三角形状而得名。三角矩阵分上三角矩阵和下三角矩阵两种。若 ,则 的矩阵称为上三角矩阵 [8],若 ,则 的矩阵称为下三角矩阵 [8]。三角矩阵可以看做是一般方阵的一种简化情形。
令 ,并且C非奇异,则矩阵 称为A的相合矩阵。其中线性变换 称为相合变换 [1]。
例如:
对于m×m的矩阵,当 时,有 ,此时所有非对角线上的元素均为0 [8],此时的矩阵称为对角矩阵。
一个分块矩阵是将矩阵分割出较小的矩阵,这些较小的矩阵就称为子块 [21]。例如:
该矩阵可以分为四个2×2的矩阵:
分块后的矩阵可以写为如下形式:
可表示为如下形式:
旋转矩阵(Rotation matrix)是在乘以一个向量的时候有改变向量的方向但不改变大小的效果的矩阵。旋转矩阵不包括反演,它可以把右手坐标系改变成左手坐标系或反之。所有旋转加上反演形成了正交矩阵的集合。
旋转矩阵是世界上著名的彩票专家、澳大利亚数学家底特罗夫研究的,它可以帮助您锁定喜爱的号码,提高中奖的机会。首先您要先选一些号码,然后,运用某一种旋转矩阵,将你挑选的数字填入相应位置。如果您选择的数字中有一些与开奖号码一样,您将一定会中一定奖级的奖。当然运用这种旋转矩阵,可以最小的成本获得最大的收益,且远远小于复式投注的成本。
旋转矩阵的原理在数学上涉及到的是一种组合设计:覆盖设计。而覆盖设计,填装设计,斯坦纳系,t-设计都是离散数学中的组合优化问题。它们解决的是如何组合集合中的元素以达到某种特定的要求。
主条目:范数
矩阵的范数主要包括三种主要类型:诱导范数,元素形式范数和Schatten范数 [13]。
若映射 满足以下要求:
则称该映射为 上的矩阵范数。
常用的诱导范数为p-范数:
p范数也称为明克夫斯基 p范数或者 范数。特别的,当 时,对应的诱导范数分别为 [23]
将 矩阵按照列的形式,排成一个 的向量,然后采用向量范数的定义,即得到矩阵的元素形式范数 [24],表式如下:
在图像处理中图像的仿射变换一般可以表示为一个仿射矩阵和一张原始图像相乘的形式 [26],例如,
这里表示的是一次线性变换再接上一个平移。
线性变换及其所对应的对称,在现代物理学中有着重要的角色。例如,在量子场论中,基本粒子是由狭义相对论的洛伦兹群所表示,具体来说,即它们在旋量群下的表现。内含泡利矩阵及更通用的狄拉克矩阵的具体表示,在费米子的物理描述中,是一项不可或缺的构成部分,而费米子的表现可以用旋量来表述。描述最轻的三种夸克时,需要用到一种内含特殊酉群SU(3)的群论表示;物理学家在计算时会用一种更简便的矩阵表示,叫盖尔曼矩阵,这种矩阵也被用作SU(3)规范群,而强核力的现代描述──量子色动力学的基础正是SU(3)。还有卡比博-小林-益川矩阵(CKM矩阵):在弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一样,但两者却是成线性关系,而CKM矩阵所表达的就是这一点。
1925年海森堡提出第一个量子力学模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子。这种做法在矩阵力学中也能见到。例如密度矩阵就是用来刻画量子系统中“纯”量子态的线性组合表示的“混合”量子态 [27]。
另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为S矩阵,其中记录了所有可能的粒子间相互作用 [28]。
矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的运动方程可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加 [29]。描述力学振动或电路振荡时,也需要使用简正模式求解 [30]。
在几何光学里,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了光波波动性的近似理论,这理论的模型将光线视为几何射线。采用近轴近似(英语:paraxial approximation),假若光线与光轴之间的夹角很小,则透镜或反射元件对于光线的作用,可以表达为2×2矩阵与向量的乘积。这向量的两个分量是光线的几何性质(光线的斜率、光线跟光轴之间在主平面(英语:principal plane)的垂直距离)。这矩阵称为光线传输矩阵(英语:ray transfer matrix),内中元素编码了光学元件的性质。对于折射,这矩阵又细分为两种:“折射矩阵”与“平移矩阵”。折射矩阵描述光线遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移行为。
由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述其光线传播路径 [31]。