上午看到FlyAI-AINLP群里李俊毅同學發出的一條信息:
最近剛翻譯、整理完的陳丹琦博士的論文,https://chendq-thesis-zh.readthedocs.io/en/latest/ ,感興趣的同學可以來看看。Neural Reading Comprehension and Beyond,里面講了很多關于神經閱讀理解的背景知識,以及作者自己的實驗思路。個人覺得適合初入nlp的以及對閱讀理解和對話感興趣的同學。才疏學淺,希望大家多多交流
趕緊去看了一下,譯者非常用心的將陳丹琦博士論文整理在了readthedocs.io上:
陳丹琦博士,本科畢業于清華姚班,之后在斯坦福大學師從 Christopher Manning 教授,今年春季她的博士論文《Neural Reading Comprehension and Beyond》一經發布就引起了整個社交媒體的亢奮:
“很少有人的博士論文能夠成為「爆款文章」,但陳丹琦做到了。這位近日從斯坦福畢業的計算機科學博士引發了人們的廣泛關注。據斯坦福大學圖書館介紹,她長達 156 頁的畢業論文《Neural Reading Comprehension and Beyond》上傳僅四天就獲得了上千次的閱讀量,成為了斯坦福大學近十年來最熱門的畢業論文之一。”
但是熱潮歸熱潮,亢奮過后還是需要安心的讀論文,這156頁博士論文,光讀完就需要很多時間,更不要說這么貼心的翻譯版了,這里要再次感謝一下譯者,以下選自這個文檔的譯者序,感興趣的同學可以點擊'閱讀原文’,直達原文鏈接:
關于這片論文的中文翻譯在這里:https://chendq-thesis-zh.readthedocs.io/en/latest/
閱讀一本優秀的博士畢業論文是最快了解一個領域的方式。這篇論文中會介紹機器閱讀理解的前因后果以及最近和未來的發展趨勢,并且,這里面會引用大量的參考文獻,這都是寶貴的經過整理的NLP相關的學習資料。
本論文文主要研究了基于深度神經網絡的閱讀理解模型。與傳統的稀疏的、手工設計的基于特征的模型相比,這些端到端神經模型被證明在學習豐富的語言現象方面更有效,并在很大程度上提高了所有現代閱讀理解基準的性能。
NLP領域逐漸進入人們的視野,從word2vec到BERT再到后來提出的一些模型,都是在dig預訓練這個環節。網絡上流傳很多資料,但很少有如此系統的文章,強推大家去仔細閱讀一下。
才疏學淺,有不足之處,還望指出。謝謝。可以直接提出issue或者通過郵件聯系:4ljy@163.com。
本文翻譯已經咨詢過原作者。
本文僅供學習交流所用,一切權利由原作者及單位保留,譯者不承擔法律責任。
原文地址:
https://www.cs.princeton.edu/~danqic/papers/thesis.pdf
陳丹琦博士個人主頁:
https://www.cs.princeton.edu/~danqic/
Duke Lee
來源:https://www.icode9.com/content-4-909101.html