精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
再談工科研究生如何做研究(第一部分)

再談工科研究生如何做研究  (第一部分)     

鄒謀炎

(中科院研究生院暑期講座材料,2012625日)

   

    我于2009年受邀做了題為“同工科研究生談談如何做研究”的報告,該報告后來貼到科學網絡上,引起了更多研究者的注意。近年來不少研究生和研究者給我發信,就如何做研究進行了更深入廣泛的討論。來信提出的問題大致集中在:如何進行研究選題;如何處理工程任務和論文工作的矛盾;如何提升研究工作的創新性;如何面對和處理就業壓力;或者如何才能成為一個創業者,等等。問題很實在和具體,來源于不同背景和發展愿望的研究生。要對所有這些問題給出中肯的回答事實上超出了我的能力。在09年那個報告中就如何做研究談了一些體會,今天的報告只集中談研究選題和科技創業兩個問題,作為對09年報告的補充。

 

一、關于研究選題

 

    1、“科研追熱”是不是可取?

 

    “科研追熱”是國際性的通病,有的學者將此稱為“魚群現象”。有人拋出一個新想法,其他人以為有事可做,于是一擁而上,形成熱點。參加討論的人多了,自然能夠對新想法進行發展和發掘,產生出若干有意義的結果。“魚群現象”的某些效果和后果是可以觀察到的。首先,新想法是提出者及其研究團隊已經成形的結果,他們始終處于創新性的制高點,其他跟蹤性研究通常難以達到重要的創新性。第二,大多數“熱點”來源于校園,而非應用需求。研究先于應用本屬正?,F象。然而,隨著熱潮趨于平穩,跟蹤性研究者們會發現,取得的研究結果難以找到應用需求,雖然他們已經為此付出了若干年的青春。這種情況對中國的研究者相當普遍。出現“魚群現象”的基本原因是大家都在找題目,大家都要生存。學校與應用部門和產業的距離越大,“魚群現象”就會越普遍。

    研究生和年輕研究者需要了解“科研追熱”的利弊。在有利方面,這自然是決定研究選題最省事的辦法,特別是,如果你的導師要你自己去選題時。作為跟蹤性研究者,通常不需要擔心論文發表問題,重要的是一定要有自己的創新點?!白窡帷背3J悄贻p研究者的生存手段之一,也是學習專業知識和訓練研究能力的有用方法。

    然而,成熟的研究者對追熱的前景必須有清醒的思考。難以形成你自己重要的創新,這是必須重視的問題。我國自然科學基金,甚至某些863、973項目的多年實踐,為此耗費了大量資金和成批研究人員的青春,這是必須反思的問題。常常一個熱潮來臨時,人們可以在外刊上讀到許多鼓吹性的“拓導”文章。那些由博士生寫的文章常常對研究前景描述得過分樂觀,而對熱點理論和應用隱藏著的底層困難缺乏描述。原因可能在于認識水平,沒有理由懷疑為故意。我們不妨回顧幾個熱點研究的例子。

 

    1:神經網絡研究。

    國外的先驅性研究可以追溯到40~50年代,在電子信息領域的大熱潮起源于1982Hopfield的工作。人工神經網絡研究最原始的訴求是要尋求大量并行感知和處理的理論、方法和技術,模仿人的視覺感知、記憶、聯想、和識別能力。隨著研究展開,卷入的研究者主要來自電子信息、計算機科學、應用數學、醫學人體科學等各個領域。取得不少進步是必須肯定的。問題是,人們的期待太急,大量并行感知、記憶、聯想和識別理論和物理機制的進步遠沒有人們希望的那樣快。涌進這個場地的人太多,許多人的工作很快就偏離了初衷。雖然Hopfield建議的能量最小化概念很容易被人們接受和模仿,當出現大量用能量最小化來處理例如數學方程求解這樣的問題時,你將它稱不稱為“神經網絡”就不重要了。數學家們關注于證明是不是能夠用最少三層網絡一致地逼近任意函數。大量研究神經網絡學習和訓練的論文,其方法基本上是局部化計算的。沒有人證明局部化的學習和訓練方法和大量并行處理是不是等價,或者大量并行處理又是什么情況。可以形象地說,所研究的若干網絡有并行的構架,但缺乏并行的神經。在80年代后期,當國外研究已經進入“冷靜期”時,中國的大熱潮正在高漲。是否取得了什么值得稱道的結果是眾所周知的。直到今天,人工神經網絡的研究仍然期待實質性的進步。為此,可能還需要更深入、冷靜的準備性研究。

    

    2:高階統計。

    80年前后高階統計就在天文圖像處理和通信信道均衡上得到應用。在電子信息領域中形成大熱潮是1987年以后的事,高峰在1990年前后,不少數學研究者也卷入其中。高階統計似乎擁有超凡的可能性,如辨識非最小相位系統。但是人們發現,一個僅僅2~3階的系統的辨識,需要10萬到幾十萬個測量數據,離實際應用太遠了。幾乎沒有文章涉及最基本的底層困難:待處理信號高階平穩性假定的確實性缺乏理論依據和仿真方法。

 

    3Markov隨機場。

    電子信息領域中Markov 隨機場的研究形成熱潮是1984年以后的事,在90年代初形成高峰,卷入者包括大量的應用數學研究者。圖像建模有幾十年的探索歷史,當Markov隨機場找到了簡潔的表達方式(Gibbs等價)后,許多人都感到興奮和看好。然而,20多年下來,真正獲得成功應用的還限于紋理分析和綜合?;纠щy在于:隨機場模型假定的空間平穩性對實際圖像一般不成立,并且缺乏有效的圖像估計算法。

 

    可舉的例子太多。僅從上面的幾個例子可以看出,如果你帶著一種審視的眼光來學習相關的新知識,用不了太深入,就可以了解到某些基本困難。雖然這只是“事后諸葛亮”的說詞,問題是我們大量的研究人員一輩子都在重復這樣的追熱循環。

   

    2、關于選題的科學性或價值

 

    有同學問,面對一個研究題目特別是熱題,我們如何判斷它的重要性或價值?我相信很難找到一般性的回答。成熟的研究人員能夠憑經驗做出某些判斷,但不能保證一定對,因為誰也無法預知待探索的結果。下面的議論僅供參考。

    有人將最重要的研究選題特征歸納為:基礎 + 未知。這里的“未知”當然是指結果在目前未知。越“基礎”越重要。如果你的工作將來會成為教科書的必要知識,那就是對人類的貢獻。當然,達到這個可能性的研究會越來越難得。不過這不妨礙作為一個思考方向。

    在選題階段就認定“創新性”是困難的,只能期盼。一個可能的選題,必須努力判定它的某些基本屬性:基本思想是原發性的還是跟隨性的?是普適性的還是特定適應性的?是理論規律性的還是技巧性的?我經歷過的若干研究項目評審中感覺到,不少研究者習慣于收集許多文章的結果,進行技巧性綜合。看起來申請書寫的內容不少,但缺乏新思想。當然,發現理論規律性通常很困難,這不但要求研究者有很深入的數學和專業理論基礎,而且要有機運。

    特定適應性在許多情況下是有價值的。典型的例子是近幾年很熱的以Curvelet變換為代表的各種X-let圖像處理技術。這些技術用于圖像去噪、修復、復原時,對某些圖像類別很有效,但不是普適地(如常規的wavelet 變換)那樣一般都比較好。這類特定適應性的思考如果能夠面向實際應用問題,例如某種合成孔徑雷達圖像處理,可能比較容易形成研究問題的思路,但這是很有限度的。在許多情況下,限制研究問題的適應范圍、深度、和尺度常常是取得有用結果的必要條件和有效方法。

    對于研究生論文過分關注選題的科學價值可能是不現實的,因為論文工作的時間和條件受限。研究生論文選題不能太大、太空,必須考慮可實施性。因此,研究生(包括博士研究生)的論文選題原則和職業或成熟研究者的選題原則應該是不完全相同的。一個成熟的研究者總是將選題的科學價值放在第一位,將達到重要的創新性作為奮斗目標。

 

    3、談談本領域的某些近期熱點

 

    由于聽講座的同學都是學信號處理和圖像處理的,我們就多聊一點這方面的研究選題問題。在最近一、二十年間,信號處理特別是圖像處理技術出現了若干亮點。主要是現代數學的許多研究成果融入信號和圖像處理,大量的數學研究者和應用科學研究者相互結合和交流,使得例如泛函分析這樣的“純數學”已經成了應用科學研究者的必修課。同樣地,一大批數學教授做起了信號和圖像處理研究,使得例如美國應用數學協會(SIAM)旗下的各種雜志大量地刊登信號和圖像處理的研究論文。這種學科上的大交融的確推動了信號和圖像處理的進步。學習信號和圖像處理專業的研究生會發現,無論是IEEE系列、SIAM系列、或其他地區出版的本領域學術刊物,許多文章都深度數學化了。未接觸過的數學概念和理論繁多,如潮水一樣涌來的文章可能會使你眼花繚亂,不知所措。不過,如果你有一定的耐性,在學習一些文章后還是有可能整理出一個相對明晰的線條。

   

   1)偏微分方程法。

    偏微分方程法從1990 Perona Malik 的工作算起已有二十幾年的歷史。它的出現使得圖像估計(重建、復原、去噪、修復等)和處理(如分割、配準)從技巧性向著科學化前進了一大步。相關的文章多,理論方法看似繁雜,其實主線條是“八股”。圖像估計問題總是表達為一個能量函數的最小化。該能量函數由兩項組成。第一項是原問題誤差,反映重建、復原、去噪、修復的機制。第二項是對解的附加限制,它保證求解問題的規整化,同時通過這個懲罰泛函表達對解圖像“外觀質量”的訴求。因為在真實世界中,質量良好的圖片,看上去是比較“卡通”的:線條清晰,黑白分明。能量函數最小化通常轉化Euler-Lagrange方程的求解。在二維下是一個偏微分方程。

    要求一個偏微分方程能夠給出一個“線條清晰,黑白分明”的解,也就是有若干跳變的解,可不是一個簡單問題。在Sobolev以前,微分方程理論基本上是處理平滑解問題。Sobolev提出了廣義導數和弱解的概念,使得求解理論可以處理連續但分段平滑的解,成為有限元方法的理論基礎。存在階躍的解沒有廣義導數,這超出了Sobolev空間涉及的范圍。在氣動力學發展過程中,為了研究激波現象,有研究者(如von Neumann)發現,在求解方程中人為地添加一個“粘性項”,可以使得沖擊波解的出現和消失過程,通過數值求解表現出來。對跳變解的需求來源于應用科學的許多領域,但圖像科學成為推動研究的主力。問題包括:什么樣的微分方程能夠給出跳變解?從機制上,什么樣的懲罰泛函能夠產生出那樣的微分方程,同時又反映對解的物理合理性的限制?如何證明最終的求解問題的解的存在和唯一?最后才是如何進行數值求解?關于“粘性解”的重新定義和應用,在80年代以后已經取得重要進展。在圖像處理領域中,我們仍然十分關心,什么樣的懲罰泛函具有希望的性質。

    限制解的總變分是一個有用方法,使得可以“容許”解出現跳變,但沒有特別“關注”解的跳變。于是研究人員在各個方面發掘可能性。讓懲罰泛函具有各向異性平滑性質是一個非常重要的思想,因為它使得圖像解線條清晰在概念上是直觀的。這方面已經報道了若干重要進展,而更好的結果仍然在探索中。擴展總變分限制,加進新限制來加強對跳變解的關注是另一個有意義的考慮。一個發展是引進Besov空間的概念。Besov空間來源于插值和有理逼近,是一個完備的賦準范數空間。它可以包括一些更基本的函數空間,如Sobolev空間。對圖像處理而言,最有用的是發現一類Besov空間Bqa(Lp) a < 1時,包含不連續函數。更進一步地,這種Besov空間的范數可以用小波變換的系數來表達。在圖像估計的懲罰泛函中引入Besov范數就成了自然的選擇。并且,小波域去噪有計算上簡單的門限方法,借此有可能大大簡化圖像估計和處理算法。

  

   2)稀疏性、壓縮感知、低秩矩陣估計、和凸優化

    信號處理中稀疏性的利用早在地震信號處理和通信信號處理中就有報道。例如將最小熵限制用于信號估計算法。讓人們對稀疏性有更深刻認識的是壓縮感知理論和方法的提出。人們發現,真實世界中的信號和圖像,有各種各樣可能的稀疏性:信號自身稀疏;信號在變換域稀疏;信號建模后模型參數很少;信號在變差域稀疏;如此等等。這些稀疏性可以作為先驗信息在信號估計中利用起來。發現可以實現超越Shannon界線的壓縮,為信息和圖像的表示、存儲、傳輸、和處理開拓了一個大領域??赡苄苑浅UT人,可以提出的問題也很多。壓縮感知成熱潮的研究已有7~8年的歷史。所報道的成果似乎沒有人們期望的那么高、那么快。應該說這是正常情況。只是我們國內的跟蹤性研究者限于在應用層面上做工作,獲得重要創新性的結果更困難些。從應用層面上說,詞典矩陣的構造仍然沒有滿意的通用方法。最主要的問題還是:信號重建需要經過一個數學規劃(優化)算法。雖然在凸和非凸優化算法方面已經報道了許多進步,離工業應用還有不小距離。

    這方面尋找研究生論文選題應該是可能的。比較可行的做法是先在應用方面了解對圖像處理的需求(壓縮、去噪、分割、檢測、跟蹤等等),同時深入學習新方法的發展,并思考和尋求應用和新方法的結合點。注意成熟研究者應該摒棄這種方法,而是為達到應用目標尋找和創造最好的方法。

   

    3)流型(manifold)和Bregman 距離

流型是非常重要的數學概念。在課程中已經介紹了一點常識,同學們可以從另一個講座材料找到科普型的介紹:“談談工科學生如何學習數學”。有同學很關心“提出流型的概念到底有什么用處”這樣的問題。今天的講座只能做粗淺的介紹。以人臉識別為例,假定人臉圖像可以簡化到只用3個數值特征來描述,一個人的各種表情就可以用一列三元數組數據描述,將這些數據放到3維空間中,就構成一個流型。張三的喜怒哀樂特征是一個流型,李四的是另一個流型。張三的表情變化只能在他自己的流型上移動,李四也是這樣。利用流型的光滑性假定,只要有適當密的表情數據訓練,他們的任何表情都可以在自己的流型上找到,而且不會和其他人的類似表情混起來。這個例子中流型的應用完全改變了圖像識別算法的思路。在“談談工科學生如何學習數學”中還介紹了來源于概率估計問題的例子,可以進一步了解流型這個概念的重要性。

無論從理論還是從應用的角度,“距離”這個概念都是一個重要話題。因為可以用它來描述兩個信號或圖像的相似程度。Euclid距離是一個太窄的概念。兩個圖像在概率分布上的相似或不同,用概率分布函數的Euclid距離顯然是不正確的,因為數學函數之間的距離和概率屬性上的不同是兩件事。流型的應用可能解決這個困難。使得我們可以考慮“在什么意義上相似”這樣的問題?;蛟S有一天,當我們比較一幅漫畫和一張照片相似的時候,“在什么意義上相似”或構造什么流型是一個思路。

 Bregman距離起源于前蘇聯數學家Bregman關于凸規劃問題求解的一個工作。它的引進和推導并不困難。很有意義的是,它為當前常用的距離度量提供了一個統一的構架,如Euclid距離;Kullback- Leibler距離;Bhattacharyya距離;I-divergence;等等。正是因為這個原因,Bregman距離和他建議的算法在圖像處理中受到高度重視。Bregman距離肯定有繼續研究的潛力。Kullback- Leibler距離有一個完美的流型上Riemann度量的解釋。但其他的距離不全是這樣。這存在著發展可能性。

    以上只簡單地介紹了近期比較熱的研究問題。

    這里需要強調的是,“追熱”是不得已的選擇。一個成熟研究者應該從熱點研究中學習知識、了解動態,但必須尋找自己的獨立研究方向。僅就圖像處理而言,報告中涉及的各個點也只是這個領域的一小塊。你們可以在圖像處理相關的國際刊物上讀到更豐富的內容。

 

    4、關于選題的幾句話

 

    從物理需求出發,不是從某個新方法出發。為了達到最好的研究目標,創造自己的理論和方法永遠是第一性的。

    提出問題,必須有清晰的物理觀念,明確的物理要求。

    解決問題,盡可能用數學描述方法,避免局限于技巧性綜合。

    專注是取得成功的有效方法。必須下決心專注于一個研究問題,不要輕言放棄。

 

    (待續)

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
中科院鄒謀炎?研究生如何做研究
同工科研究生談談如何做研究
數字圖像處理與識別技術概況
MIT人工智能實驗室:如何做研究?
入門計算機視覺必知的技術有哪些?
機器之心
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 红河县| 安龙县| 甘南县| 策勒县| 冷水江市| 金门县| 登封市| 拉萨市| 普格县| 新干县| 台安县| 伊宁市| 凤山县| 友谊县| 浦县| 长兴县| 山丹县| 当阳市| 漠河县| 湘乡市| 孝义市| 慈利县| 临猗县| 汉寿县| 洱源县| 连云港市| 高台县| 兴安盟| 门源| 涟源市| 眉山市| 平顺县| 黄石市| 武功县| 嘉定区| 日土县| 凤阳县| 咸丰县| 澄江县| 紫云| 漠河县|