理解矩陣
- 文件介紹:
- 該文件為 txt 格式,下載需要 10 積分
- 線性代數課程,無論你從行列式入手還是直接從矩陣入手,從一開始就充斥著莫名其妙。比如說,在全國一般工科院系教學中應用最廣泛的同濟線性代數教材(現在到了第四版),一上來就介紹逆序數這個“前無古人,后無來者”的古怪概念,然后用逆序數給出行列式的一個極不直觀的定義,接著是一些簡直犯傻的行列式性質和習題——把這行乘一個系數加到另一行上,再把那一列減過來,折騰得那叫一個熱鬧,可就是壓根看不出這個東西有嘛用。大多數像我一樣資質平庸的學生到這里就有點犯暈:連這是個什么東西都模模糊糊的,就開始鉆火圈表演了,這未免太“無厘頭”了吧!于是開始有人逃課,更多的人開始抄作業(yè)。這下就中招了,因為其后的發(fā)展可以用一句峰回路轉來形容,緊跟著這個無厘頭的行列式的,是一個同樣無厘頭但是偉大的無以復加的家伙的出場——矩陣來了!多年之后,我才明白,當老師犯傻似地用中括號把一堆傻了吧嘰的數括起來,并且不緊不慢地說:“這個東西叫做矩陣”的時候,我的數學生涯掀開了何等悲壯辛酸、慘絕人寰的一幕!自那以后,在幾乎所有跟“學問”二字稍微沾點邊的東西里,矩陣這個家伙從不缺席。對于我這個沒能一次搞定線性代數的笨蛋來說,矩陣老大的不請自來每每搞得我灰頭土臉,頭破血流。長期以來,我在閱讀中一見矩陣,就如同阿Q見到了假洋鬼子,揉揉額角就繞道走。
事實上,我并不是特例。一般工科學生初學線性代數,通常都會感到困難。這種情形在國內外皆然。瑞典數學家Lars Garding在其名著Encounter with Mathematics中說:“如果不熟悉線性代數的概念,要去學習自然科學,現在看來就和文盲差不多!,然而“按照現行的國際標準,線性代數是通過公理化來表述的,它是第二代數學模型,...,這就帶來了教學上的困難!笔聦嵣,當我們開始學習線性代數的時候,不知不覺就進入了“第二代數學模型”的范疇當中,這意味著數學的表述方式和抽象性有了一次全面的進化,對于從小一直在“第一代數學模型”,即以實用為導向的、具體的數學模型中學習的我們來說,在沒有并明確告知的情況下進行如此劇烈的paradigm shift,不感到困難才是奇怪的。
大部分工科學生,往往是在學習了一些后繼課程,如數值分析、數學規(guī)劃、矩陣論之后,才逐漸能夠理解和熟練運用線性代數。即便如此,不少人即使能夠很熟練地以線性代數為工具進行科研和應用工作,但對于很多這門課程的初學者提出的、看上去是很基礎的問題卻并不清楚。比如說:
* 矩陣究竟是什么東西?向量可以被認為是具有n個相互獨立的性質(維度)的對象的表示,矩陣又是什么呢?我們如果認為矩陣是一組列(行)向量組成的新的復合向量的展開式,那么為什么這種展開式具有如此廣泛的應用?特別是,為什么偏偏二維的展開式如此有用?如果矩陣中每一個元素又是一個向量,那么我們再展開一次,變成三維的立方陣,是不是更有用?
* 矩陣的乘法規(guī)則究竟為什么這樣規(guī)定?為什么這樣一種怪異的乘法規(guī)則卻能夠在實踐中發(fā)揮如此巨大的功效?很多看上去似乎是完全不相關的問題,最后竟然都歸結到矩陣的乘法,這難道不是很奇妙的事情?難道在矩陣乘法那看上去莫名其妙的規(guī)則下面,包含著世界的某些本質規(guī)律?如果是的話,這些本質規(guī)律是什么?
* 行列式究竟是一個什么東西?為什么會有如此怪異的計算規(guī)則?行列式與其對應方陣本質上是什么關系?為什么只有方陣才有對應的行列式,而一般矩陣就沒有(不要覺得這個問題很蠢,如果必要,針對m x n矩陣定義行列式不是做不到的,之所以不做,是因為沒有這個必要,但是為什么沒有這個必要)?而且,行列式的計算規(guī)則,看上去跟矩陣的任何計算規(guī)則都沒有直觀的聯系,為什么又在很多方面決定了矩陣的性質?難道這一切僅是巧合?
* 矩陣為什么可以分塊計算?分塊計算這件事情看上去是那么隨意,為什么竟是可行的?
* 對于矩陣轉置運算AT,有(AB)T = BTAT,對于矩陣求逆運算A-1,有(AB)-1 = B-1A-1。兩個看上去完全沒有什么關系的運算,為什么有著類似的性質?這僅僅是巧合嗎?
* 為什么說P-1AP得到的矩陣與A矩陣“相似”?這里的“相似”是什么意思?
* 特征值和特征向量的本質是什么?它們定義就讓人很驚訝,因為Ax =λx,一個諾大的矩陣的效應,竟然不過相當于一個小小的數λ,確實有點奇妙。但何至于用“特征”甚至“本征”來界定?它們刻劃的究竟是什么?
這樣的一類問題,經常讓使用線性代數已經很多年的人都感到為難。就好像大人面對小孩子的刨根問底,最后總會迫不得已地說“就這樣吧,到此為止”一樣,面對這樣的問題,很多老手們最后也只能用:“就是這么規(guī)定的,你接受并且記住就好”來搪塞。然而,這樣的問題如果不能獲得回答,線性代數對于我們來說就是一個粗暴的、不講道理的、莫名其妙的規(guī)則集合,我們會感到,自己并不是在學習一門學問,而是被不由分說地“拋到”一個強制的世界中,只是在考試的皮鞭揮舞之下被迫趕路,全然無法領略其中的美妙、和諧與統一。直到多年以后,我們已經發(fā)覺這門學問如此的有用,卻仍然會非常迷惑:怎么這么湊巧?
我認為,這是我們的線性代數教學中直覺性喪失的后果。上述這些涉及到“如何能”、“怎么會”的問題,僅僅通過純粹的數學證明來回答,是不能令提問者滿意的。比如,如果你通過一般的證明方法論證了矩陣分塊運算確實可行,那么這并不能夠讓提問者的疑惑得到解決。他們真正的困惑是:矩陣分塊運算為什么竟然是可行的?究竟只是湊巧,還是說這是由矩陣這種對象的某種本質所必然決定的?如果是后者,那么矩陣的這些本質是什么?只要對上述那些問題稍加考慮,我們就會發(fā)現,所有這些問題都不是單純依靠數學證明所能夠解決的。像我們的教科書那樣,凡事用數學證明,最后培養(yǎng)出來的學生,只能熟練地使用工具,卻欠缺真正意義上的理解。
自從1930年代法國布爾巴基學派興起以來,數學的公理化、系統性描述已經獲得巨大的成功,這使得我們接受的數學教育在嚴謹性上大大提高。然而數學公理化的一個備受爭議的副作用,就是一般數學教育中直覺性的喪失。數學家們似乎認為直覺性與抽象性是矛盾的,因此毫不猶豫地犧牲掉前者。然而包括我本人在內的很多人都對此表示懷疑,我們不認為直覺性與抽象性一定相互矛盾,特別是在數學教育中和數學教材中,幫助學生建立直覺,有助于它們理解那些抽象的概念,進而理解數學的本質。反之,如果一味注重形式上的嚴格性,學生就好像被迫進行鉆火圈表演的小白鼠一樣,變成枯燥的規(guī)則的奴隸。
對于線性代數的類似上述所提到的一些直覺性的問題,兩年多來我斷斷續(xù)續(xù)地反復思考了四、五次,為此閱讀了好幾本國內外線性代數、數值分析、代數和數學通論性書籍,其中像前蘇聯的名著《數學:它的內容、方法和意義》、龔昇教授的《線性代數五講》、前面提到的Encounter with Mathematics(《數學概觀》)以及Thomas A. Garrity的《數學拾遺》都給我很大的啟發(fā)。不過即使如此,我對這個主題的認識也經歷了好幾次自我否定。比如以前思考的一些結論曾經寫在自己的blog里,但是現在看來,這些結論基本上都是錯誤的。因此打算把自己現在的有關理解比較完整地記錄下來,一方面是因為我覺得現在的理解比較成熟了,可以拿出來與別人探討,向別人請教。另一方面,如果以后再有進一步的認識,把現在的理解給推翻了,那現在寫的這個snapshot也是很有意義的。
因為打算寫得比較多,所以會分幾次慢慢寫。也不知道是不是有時間慢慢寫完整,會不會中斷,寫著看吧。
...