面向計算的中文語法研究: 形義對應複雜性的挑戰
講座提要:
現代語言科學的研究追求可以概括為三個充分:觀察充分、描寫充分、解釋充分。而觀察、描寫、解釋 的對象,實則聚焦於語言符號的形式與意義之間的對應關係。語言形式與意義複雜多樣的對應方式,對計算機 的語言信息處理構成了極大的挑戰。本次講座介紹計算語言學領域中符號主義的研究範式,即在人類專家對語 言現象的充分觀察、描寫和理論解釋基礎上,進一步將語言知識結構化、形式化和數據化,形成計算機可用的 語言知識資源,從而幫助計算機更好地處理自然語言負載的信息,直至達到理解人類語言的水平。
主講人:詹衛東教授,北京大學中文系教授,博士生導師,兼任北京大學 中國語言學研究中心副主任、計算語言學研究所副所長。教 育部“新世紀優秀人才”,教育部“青年長江學者”。主要 從事現代漢語形式語法、語言知識工程與中文信息處理、語 言文字應用方面的研究。代表性成果有《面向中文信息處理 的現代漢語短語結構規則研究》,國家語言文字標準《出版物上數字用法》及配套讀本《〈出版物上數字用法〉解 讀》。參編《計算語言學概論》《自然語言處理》《現代漢 語》等多部教材。在國內外學術刊物發表論文八十餘篇。近 年來的學術興趣主要集中在現代漢語構式資源的構建和應 用,機器語言理解能力評測任務的設計與數據集研製等。
講座時間:2023.03.08(星期三 WED) 19:00
讲座地点:E21-2100 / 403-056-546 (騰訊會議)