Selected Articles 論文

Year 2025

提要:本文主要討論 ChatGPT 等語言大模型到底做對了什麼,才得以生成語言通順和內容連貫的文本。 文章首先介紹機器和人類在問題解決等方面的差別(難易倒置),說明語言大模型不是只會轉換符號的“中文房間”,而是一個能夠通過文本中的有關描述來重構世界模型的“柏拉圖洞穴”。 然後介紹辛頓和蘇茲凱維等語言大模型奠基者對於大模型的工作機理的有關見解,通過分析包含名詞“桌子”和形容詞“餓”的語句的意義,說明大模型通過訓練語料,完全可以學到關於人跟物體與感覺等互動的世界知識,構建近似的世界模型。 因此,即使語言只是交際工具而不是思維工具,語言大模型依然能夠通往通用人工智慧。

全文瀏覽ChatGPT等語言大模型…界模型和感覺知識的來源探祕_袁毓林

提要:本文首先對前人關於離合詞的有關研究進行評述,並嘗試回答葉狂、潘海華( 2018) 對離合詞“轉喻說”的質疑。然後立足於真實文本語料,沿用“形式轉喻”來解釋詞語的離散用法,用“可伸縮構式”這個動態性概念,說明語言構式在交際使用中有規律的變異形式及其表達功能; 並使用“構式套用”來解釋“類離合詞”和詞語的臨時性離散用法的生成機制。這種解釋模式能夠在一定程度上說明離合詞及離散用法不斷擴展的現象,也能夠進一步解釋非雙音詞離散、黏著語素獨立使用等現象。

全文瀏覽從構式的模板套用到“可伸縮構式”的形成——轉喻視角下漢語詞彙離散現象的重新解析

提要:本文通過考察 ChatGPT 在指稱歧義句、花園幽徑句和遞歸嵌套句等三種複雜句的語義理解上的表現,來討論下列問題:ChatGPT 等現代大型語言模型到底能不能理解語言的意義? 它們真的只是一種不顧意義的隨機鸚鵡嗎? 文章發現,ChatGPT 在指稱歧義句和一般遞歸結構的理解方面表現出色,在花園幽徑句的理解方面表現平凡;在中心內嵌的遞歸結構的理解方面,跟人類一樣表現不佳。由此,文章指出,ChatGPT 等語言大模型能夠理解語句的語言性意義,但是未必能夠理解語句背後隱微的交際意義和具身意義。最後,文章展望,語言學可為建設關於多種意義的理解的新型智能科學做出獨特的貢獻。

全文瀏覽從三種複雜句看ChatGPT是不是隨機鸚鵡?——語言大模型能不能理解語言意義的測試與討論_袁毓林

提要:本文在現代大語言模型語境下反思語言學研究的兩種目標之爭:精確描寫(語言事實,how)還是科學解釋(語言能力,why)?以此為中心,討論了一系列相關的問題,並考察了 ChatGPT 能否捕獲長距離依存、能否理解句法與語義分離的句子、對語言的科學解釋與精確描寫是否對立。得出的結論是:(1)ChatGPT 等大模型能夠超越馬爾可夫過程模型,來捕獲語句中不同詞語之間的長距離依存關係;能夠隱式地學習基本的句法和語義知識,從而理解、識別和生成語義異常的句子。(2)對語言的精確描寫和科學解釋並不對立,並且前者比後者更加重要。(3)生成語法學的“原則與參數”範式下的範疇語法,對於描寫人類自然語言有不可克服的困難。 (4)語法學的研究取向應該是語義優先,而不是句法優先。(5)大模型的成功說明:對語言事實的準確描寫遠比對語言能力的抽象解釋更為基本。

全文瀏覽 描寫還是解釋:由ChatGPT反思語言學的兩種目標_袁毓林

提要:本文簡要討論人工智慧語言大模型等自動寫作工具對大學本科論文寫作訓練的影響及相關對策。首先簡單介紹有關 AI 使用報告的調查數據,說明年輕人使用 AI 的頻繁性與普遍性;然後通過引證有關專家的觀點與討論,提出問題:AI 自動寫作工具會不會破壞大學對本科生的論文寫作訓練?最後引用一位專家的經驗,嘗試對大學生怎樣利用 AI 自動寫作工具提出一些具體的建議;此外,對語言學研究生怎樣有效使用 DeepSeek 和 ChatGPT等語言大模型來協助專業論文寫作,給出初步建議。

全文瀏覽_人工智能寫作對大學論文寫作的影響與對策  袁毓林

提要:汉语背衬优先认知定势提升了背衬论元角色的前置竞争力、句法独立性及跨句延续能力。在典型显体论元角色缺席的非及物事件中,在背衬优先的认知定势支持下,汉语背衬论元角色足以跟非典型显体论元角色相抗衡而分享前置权。可前置论元角色的范围拓展至方所等背衬论元角色,为首尾论元角色易位创造了宽松自由的条件。英语显体优先的认知定势压制背衬论元角色的前置竞争力,将它排挤至动词后,降低了背衬论元角色的句法独立性和跨句延续能力,缩小了可前置论元角色及首尾论元角色可易位的范围。具有人类普遍心理学基础的背衬和显体分工,跟特定文化的哲学基础相互作用形成特定认知定势,对论元角色的前置权博弈采取或支持或压制的不同策略,塑造了汉英论元角色分布的不同格局,分别形成“话题突出”和“主语突出”的类型学特征。

全文瀏覽_認知定勢與論元角色分佈優勢的漢英差異   陳忠

提要:本文由辛頓在獲諾貝爾獎感言中對喬姆斯基語言學的批評,反思語言學研究的路線與方向。首先,扼要引述辛頓在多個場合對喬姆斯基的批評,就此提出兩個問題:(1)語言大模型的成功能不能顛覆語言天生理論?(2)生成語法理論有沒有把語言學的方向帶偏了?然後通過簡介Piantadosi(2023)和進化神經生物學等有關觀點和實驗,說明生成語法的研究範式不符合人類樸素的心智。接著,簡單比較近 70 年來人工智能和生成語言學的發展歷程,說明學派競爭和客觀評測是推動學術進步的有效路徑。最後,通過分析喬姆斯基對其學術思想及其歷程的自述,說明語言天生理論和普遍語法雖然不易證偽,但是更難證明其成立。

全文瀏覽_由辛頓的獲獎感言反思語言學研究的路向  袁毓林

提要:現行的共同語語法標準存在多方面缺陷,已不能有效地指導規範工作。基於民族共同語標準適度多元論的理念,我們建議放棄“以典範的現代白話文著作為語法規範”這一模糊、僵化、片面的表述,將共同語的語法標準修改為“以北京話語法為基礎語法”。北京話當然包括口語和書面語兩種形式,其基礎作用主要體現在區域變體的語法格式必須和北京話之間存在很高的相互理解度。方言語法格式要進入共同語必須同時滿足三項必要條件:體系性,即契合已有系統;穩定性,即已經約定俗成;可理解性,即跟北京話使用者之間可以用書面語和口語兩種形式順暢交流。

全文瀏覽_語法規範的標準與方言語法格式進入共同語的條件   董思聰、徐杰

提要:本文通過呂叔湘先生四個漢語語法的研究案例,說明他在治學理路上具有既尊重事實又通達圓融的特點:1)從呂先生對於語言、語法、詞和語素等概念的解釋,揭示他深入淺出、舉重若輕的著述特色;2)從呂先生對於詞類劃分的目的、標準的闡釋及跟同行的辯難,揭示他尊重事實、不拘教條的為學風格;3)從呂先生對於有關句式的語義特點、分類的理想標準和主語的二重性的論述,展示他洞燭幽微、提煉精警的學術觀察和概括能力;4)從呂先生對於語法體系和若干語法難題的論述,反映他大處著眼、小處著手的治學特色。 最後,說明漢語語法研究創新的希望在於年輕學者。

全文瀏覽尊重事實 通達圓融——從四個案例看呂叔湘先生的治學理路  袁毓林

Year 2024

提要:本文討論“X 不敢相信 Y”構式的三種不同的構式意義及其敘實性特點。文章指出,由於謂語核心“相信”是表示信念的非敘實動詞,因此這種構式原本是非敘實的( 不預設賓語所指的命題 y 為真或為假) ,其組合性意義為“x 不願意信任 y,y 可真可假”。但是,在驚訝於事實顛覆信念的心理作用( 即“魔術效應”) 下,這種構式轉變為敘實的( 預設 y 為真) ,湧現出了“x 不情願地懸置不信任 y,因為 y 居然為真”之類強勢的規約性意義。進而在特定的語境條件下,受 x 堅持質疑和不肯懸置不信任 y 的心理驅使,又解鎖出“x 不願意懸置不信任 y,因為y 顯然為假”之類弱勢的規約性意義,即轉變為反敘實構式( 預設 y 為假) 。並且,在數量上,這種構式的敘實用例絕對地壓倒其反敘實用例和非敘實用例。

全文瀏覽X不敢相信Y”構式的敘實…不情願地懸置不信任”的心理_袁毓林

提要:文章利用 19 世紀中期至 20 世紀中期中日大規模歷時語料庫,考察“X 式”與“X 式 Y”在這一個世紀的歷時演進,梳理還原“式”語義演變的具體路徑和動因,以及“式”的演變之於修辭構式“X 式 Y”形成的關鍵性作用。文章認為,受語言接觸的影響,“式樣”義的“式”語義發生了辭彙性演變。其語義演變路徑有二:一為“式”在特定語境中經由語用推理獲得了抽象的“形式、方式、方法”義,二為“式”借用了日語的“類型”義。原本具有客觀分類命名功能的“X 式 Y”,在“式”和“Y”均抽象化後,發生了主觀化,形成具有主觀評價功能的“X 式 Y”修辭構式。

全文瀏覽“式”的語義演變與修辭構式“X式Y”的形成_王銘宇

提要:本文簡單解釋 ChatGPT 等現代大型語言模型的語言處理機制和數學原理及其理論蘊涵。首先,通過 ChatGPT 對代詞指稱歧義句的理解,來說明語言大模型在語義理解和常識推理方面的性能;接著,介紹轉換器這種語言模型的新穎構架,特別是其注意力機制及其功能;還介紹基於分佈語義學的詞的向量化嵌入表示,以及詞向量在語言處理和類比推理方面的作用;然後詳細介紹轉換器模型怎樣通過注意力機制和前饋網路,來追蹤和傳遞詞語之間的句法語義關係資訊,從而成功地預測下一個詞語並生成合適的文本;最後簡介語言大模型的訓練方式,並說明大模型怎樣用“再造語言”的方式,幫助我們重新認識人類自然語言的有關特點(分佈性和預測性),啟發我們反思既有的句法學和語義學理論。

全文瀏覽ChatGPT等大模型的語言處理機制及其理論蘊涵_袁毓林

提要:本文首先介紹《名詞句法語義信息詞典》的內容結構與理論背景,然後介紹其所區分的 5 種名詞小類的定義及其跟 7 種量詞的選擇限制,其為名詞所設置的 10 種物性角色及其定義,由目標名詞跟這些物性角色的不同配置而造成的 10 來種句法格式及其例句,其所考察的名詞的 8 種主要的語法功能及其對於該詞類的隸屬度;最後給出《名詞句法語義信息詞典》中檢索系統的介面截圖。

全文瀏覽《名詞句法語義信息詞典》知識內容說明書 袁毓林

提要:本文首先簡介 ChatGPT怎樣顛覆自然語言處理的工作範式和語言學的有關信條,然後介紹 Piantadosi (2023)怎樣通過對比現代大型語言模型的工作機理與生成語言學的研究路徑,得出以下這個極具批判性和震撼力的結論:現代機器學習已經顛覆並繞過了喬姆斯基方法的整個理論框架。 為了便於大家的閱讀與理解,本文圍繞著下麵三個問題來介紹和評述 Piantadosi(2023): 1)現代語言模型能不能看作是一種語言理論? 2)現代語言模型及其工作原理能不能禁得住語言學家的質疑? 3)現代語言模型及其表現能不能反駁喬姆斯基的語言學主張? 最後,文章指出,面對現代大型語言模型在語言運用上的出色表現,我們應該摒棄鴕鳥法、權威法和先驗法,採用正視問題、勇於懷疑、不斷試錯與驗證的科學法。

全文瀏覽ChatGPT等大型語言模型對語言學理論的挑戰與警示_袁毓林

提要:袁毓林(2024)提出了語言學家跟語言大模型協同的三種方式,並舉出了一些人機合作進行語言研究的例子(即大小不一的課題)。 本文則介紹了用這些問題對 ChatGPT3. 5 進行測試的結果,以及對此結果的評論。 總的情況是: ChatGPT3. 5 在造特定語義類型的句子、有關課題研究的綜述和熱門論題的小論文寫作等方面,表現良好;而對於特定詞法的詞語的檢索和對於特定語法現象背後的複雜語法規律的概括和提取,則表現不佳。 但是,隨著人工智慧技術的進步, ChatGPT 等大模型有望勝任語言學家的合作夥伴。

全文瀏覽ChatGPT能不能勝任語言學家的合作伙伴__袁毓林

提要:ChatGPT 在語言理解和生成方面的成功,對語言學有關傳統觀念提出了挑戰。本文據此重點討論了人工智慧時代語言學家不可回避的三個問題:1) 怎樣看待 ChatGPT 等語言大模型生成的語言?2) 怎樣為語言模型等人工智慧系統提供語義學支持?3) 怎樣跟語言大模型等人工智慧系統形成人機協同?對此,我們嘗試性的回答是:1)“機造語言”是一種“仲介語”;2) 應該把指稱論語義學和分佈式語義學結合起來;3) 人機協同有嵌入、副駕駛和智能體三種模式。

全文瀏覽ChatGPT語境下語言學的挑戰和出路_袁毓林

提要:澳門開埠時葡籍人口占了一半,此後在澳葡政府管治的400餘年間,葡語一直是澳門的唯一官方語言。從這個意義上,可以判斷澳門的語言使用狀況從一開始就是中葡雙語。鴉片戰爭前後 , 由於英國在東亞的影響逐漸擴大 , 加上香港從 20 世紀開始成為一個國際化大都市,澳門在中葡雙語的基礎上又增加了英語,形成了迄今為止的中英葡三語格局。這一語言運用演變歷程說明,任何國家和地方語言生態的形成都是當地政治、經濟及社會因素長期競爭和妥協的結果。

全文瀏覽_澳門多語景觀的形成發展及其折射的語言運用演變歷程

提要:澳門在發展成為“世界旅遊休閒中心”的戰略目標下,旅遊業迎來了前所未有的發展機遇。本文廣泛收集澳門旅遊業的語料,構建了澳門旅遊漢語語料庫,並根據 BIC 演算法提取了主題詞。對子語料庫酒店業特色旅遊漢語語料庫進行分析發現,酒店業的辭彙分佈符合齊夫定律,以雙音節詞為主;主題詞覆蓋從客房、設施到餐飲、健身、個性化服務等方面,展現了澳門酒店業通過周到的服務來滿足客戶需求,進而打造具有特色的體驗。酒店業作為專門用途漢語的重要組成部分,對其辭彙的研究對於解決遊客、漢語學習者和旅遊業從業人員的語言需求、推動澳門旅遊業的發展具有重要意義。

全文瀏覽_澳門酒店業特色旅遊漢語語料庫建設_王珊

提要:辭彙增長模型能夠通過分析詞種(Types)與詞例(Tokens)之間的關係,揭示辭彙演變。澳門作為一個多語言、多文化交匯的城市,其辭彙使用能夠反映社會熱點。然而,目前關於澳門辭彙演變的研究較少。本研究選擇澳門中文媒體《澳門時報》構建新聞語料庫,應用 3 種辭彙增長模型擬合辭彙變化,並根據效果最佳的 Heaps 模型,進一步探討辭彙變化與新聞內容之間的關聯性。結果表明,澳門新聞辭彙的演變與國內外熱點事件、施政方針以及民生緊密相關。此外,通過分析打亂文本時序後的文本,驗證了所採用方法的有效性。對《澳門時報》辭彙演變的分析為深入理解澳門的語言生活提供了重要參考。

全文瀏覽_澳門中文媒體的詞彙演變——以《澳門時報》爲例  王珊

提要:論感是一個既區別於語感又區別於理論,同時又與兩者緊密關聯的概念,指的是對語言現象背後的條件、理據和規則、規律的直覺判斷或感受,簡言之就是對語言交際中蘊涵的某種理論因素的直覺感知。論感具有直覺啟發性、現象依存性、弱論證性等前理論性特徵,是現象到理論的仲介。以此為基礎,本文從觀點、觀念、方法等方面概括了論感的基本類型和層次。論感的生髮過程由潛而顯,可以從本體論、方法論、體系架構、基本目標等多個角度來審視從論感走向理論建 構的基本路徑。論感現象在各個研究領域都有普遍性,研究者應該努力培養高層次論感,提升理論創新能力。

全文瀏覽_從論感走向理論建構 施春宏、袁毓林

提要:本文主要考察“工具+動詞+受事”“材料+動詞+結果”和“處所+動詞+受事”三類主賓易位句。文章以生成過程為切入點,從物性關係的角度分析三種主賓易位句的合格性條件。文章將三種主賓易位句的構式義總結為“功用—處置”“功用—行為”和“處置—行為”,並說明了功用、行為和處置三者之間聯繫的普遍性。最後,文章把上述結論推廣到其他主賓易位句中,進一步證明了結論的可靠性。

全文瀏覽_從物性關係看主賓易位句的合格性條件和構式意義   尹常樂、袁毓林

提要:作為功能範疇的否定存在類型差異,否定可以劃分出三種類型:句子否定、短語否定和構詞否定。本文提出了較有操作性的句法語義特徵標準,將三類否定明確區分開來,並演示了三類否定的確立能解釋哪些語言現象,能處理此前哪些讓人倍感困擾的難題。否定是一種屬於全句的功能範疇,其否定範圍正是它所依附的那個句子,其否定中心就是該句的焦點,不能另立中心。但是,這一論斷只適用於句子否定,不適用於短語否定和構詞否定。

全文瀏覽_否定類型及與此相關的句法語義問題

提要:據現有研究,福建閩語並無多功能詞“放”,廣東閩語“放”的多功能特徵表現則非常突出。本文自東向西,以廣東東部潮州、中部中山、西部茂名三地閩語為考察對象,通過田野調查,全面描寫三地閩語“放”的多功能特徵,並對這種多功能特徵的形成機制進行考證。研究表明,廣東閩語多功能詞“放”的形成既有語義沾染特徵,又體現動詞向介詞演變的多重語法化路徑,同時兼具方言、民族語接觸的實體借貸、模式借貸發展脈絡。對廣東閩語多功能詞“放”的功能分佈與形成機制的考證,是運用語法化理論及語言接觸視角觀察方言語法現象的有效個案。廣東閩語多功能詞“放”的分佈特徵與形成機制亦對同處於多語多方言地帶的其他多功能詞形成模式研究具有參考價值。

全文瀏覽廣東閩語多功能詞“放”——内部演變與外部接觸共現的個案_徐宇航

提要: 廣東陽江粵方言的“浮”具有實義動詞、趨向動詞、動相補語、傀儡可能補語、起始體助詞、話題標記用法,其多功能特徵不見於其他粵方言,卻與閩南方言部分類同。本文全面描寫“浮”的多功能用法,重構其語法化過程,並解釋其多功能特徵的來源。

全文瀏覽廣東陽江方言的多功能詞“浮”_徐宇航、戴瑜殷

提要:本文按照變異社會語言學的“三次浪潮”框架(Eckert2012),對過去五年的變異研究文獻進行分類考察後發現,超過一半的研究採用了第一次浪潮的經典範式,數量多於使用後起範式的研究。近年來,屬於第一次浪潮的變異研究經典範式不斷創新,比如整合共時、歷時材料,與認知心理學和電腦科學相結合等等,本文系統論述了這些創新點及相應的挑戰。另外,本文指出對變異研究來說最大的挑戰是如何整合三次浪潮的研究成果,建構一個更全面、更普適的理論框架以實現微觀社會語言學與宏觀社會語言學的有機融合。

全文瀏覽_國際變異社會語言學研究新進展   張璟瑋

提要: 自然語言有關表達中潛藏了豐富的預期和常 識,讓轉複句“雖 然 A,但 是 B”格式是其中的代表。從語言學知識應用於人工智慧的角度來看,挖掘語言中的常識有助於構建常識庫,支持常識推理。研究過程是通過構建“取反→簡化→補全→泛化→聯結”的形式化操作流程,提取讓轉複句中蘊涵的預期資訊,證明語用資訊也能通過形式化方式提取。根據格式中“A”和“¬B(非 B)”是否存在因果關聯,讓轉複句中的預期可分為基於直覺推理的預期、基於經驗的預期和基於百科知識的預期三類。根據“A”和“¬B”的語義關聯性及推理方式,基於直覺推理的預期可進一步分為屬性類推、屬性對比、量級類推、屬性繼承、屬性值保持和屬性值趨同六類;按照時間和空間兩個維度,基於經驗的預期可分為基於預測類經驗的預期和基於共現類經驗的預期兩類。其中,基於經驗的預期和基於百科知識的預期可以歸納為常識,收集並構建常識庫。最後舉例介紹了怎樣利用本文抽取的小型常識庫進行智能問答和溯因推理。

全文瀏覽_ 漢語讓轉複句的預期類型與常識發現研究  盧達威、袁毓林

提要:湖北監利語的句末詞“在”只能出現在表示靜態持續意義的句子中。這些句子必須是根句或是帶有時間狀語的關係子句,不能出現在非限定子句中。句末“在”對謂語動詞有兩方面的語義要求。首先,謂語動詞必須是自主動詞;其次,謂語表達的情景體必須是靜態的、持續的、無終結點的。監利語的句末“在”既不是句末語氣助詞,也不是句末體貌助詞,它是限定範疇的標記,具有說話者屬性,可以通過引入說話者來錨定說話時間,幫助句子獲得時間解讀。

全文瀏覽_論時態與限定範疇——以監利贛語的句末詞“在”爲例   劉鴻勇

提要:日語語法標注規則在文獻中討論的不多,在國內的日語語言學論著中尚未得到廣泛應用,在國外的英文出版物中也存在著使用不規範的現象。本文介紹萊比錫標注規則在日語文本標注中的應用,並通過分析以往研究中語法標注和語素切分相關的問題和爭議,提出初步的日語語法標注規則。

全文瀏覽_日語語法標註規則芻議  楊文江

提要: ChatGPT 等大語言模型在語義理解和常識推理方面表現優秀,其技術奧秘在於模型開發者在對詞語進行向量表示時,遵循分佈式語義學原理,採用了“嵌入”這種代數方法。但是,經典的測試語言運用等智能水準的“圖靈測試”,難以識別欺騙和回避等作弊手段,因此,電腦科學家設計了“新圖靈測試”,其中的威諾格拉德模式挑戰與語言學關係密切。這一模式以代詞消歧為測試點設計句子對和問題,但是經過大規模語料訓練的語言模型可以憑藉辭彙上的統計相關性,而不是靠真正理解句子的意義來給出正確答案。為克服這一缺陷,學者們又發展出 WinoGrande 數據集,提高了數據的規模和難度,確保它們無法通過網路搜索等手段來得到正確答案。我們用威諾格拉德模式設計了無偏向雙重句子對測試 ChatGPT,展示了大語言模型在語義理解和常識推理方面已達到接近人類的水準。當然,從具身模擬假說來看,大語言模型不可能像人一樣富有體驗性地理解人類自然語言。最後,我們呼籲:語言學家應該積極參與構建 WinoGrade 測試集之類的工作,在人工智慧時代擴展自身的學術研究領域。

全文瀏覽如何測試ChatGPT的語義理解與常識推理水平——兼談大語言模型時代語言學的挑戰與機會_袁毓林

提要: ChatGPT 等大語言模型在語義理解和常識推理方面表現優秀,其技術奧秘在於模型開發者在對詞語進行向量表示時,遵循分佈式語義學原理,採用了“嵌入”這種代數方法。但是,經典的測試語言運用等智能水準的“圖靈測試”,難以識別欺騙和回避等作弊手段,因此,電腦科學家設計了“新圖靈測試”,其中的威諾格拉德模式挑戰與語言學關係密切。這一模式以代詞消歧為測試點設計句子對和問題,但是經過大規模語料訓練的語言模型可以憑藉辭彙上的統計相關性,而不是靠真正理解句子的意義來給出正確答案。為克服這一缺陷,學者們又發展出 WinoGrande 數據集,提高了數據的規模和難度,確保它們無法通過網路搜索等手段來得到正確答案。我們用威諾格拉德模式設計了無偏向雙重句子對測試 ChatGPT,展示了大語言模型在語義理解和常識推理方面已達到接近人類的水準。當然,從具身模擬假說來看,大語言模型不可能像人一樣富有體驗性地理解人類自然語言。最後,我們呼籲:語言學家應該積極參與構建 WinoGrade 測試集之類的工作,在人工智慧時代擴展自身的學術研究領域。

全文瀏覽_聲調變異與變化研究:回顧與展望_張璟瑋

提要:石洞侗語中含度量短語(MP)的名詞性結構有 MP+NP 和 MP+li33+NP 兩種形式。度量短語在這兩種結構中有不同的語義解讀。MP + NP 結構中的度量短語只有單調性解讀,而 MP+li33+NP 結構中的度量短語既允許單調性解讀,也允許非單調性解讀。度量短語的語義解讀與以下三個因素有關:名詞本身的特性、度量詞本身的特性、名詞性短語的內部句法結構。

全文瀏覽_石洞侗語名詞性結構中的度量短語 龍仙梅、劉鴻勇

提要:新的時代有新的文化形態。本文從語言學角度探討數智時代的技術對新時代語言認同和文化認同的影響。在數字時代,數字通信可以增強用戶既有的語言和文化認同; 社交媒體則是少數群體表達隱性認同的平臺,也是多語、多元文化認同者實現跨語言、跨文化認同的平臺。進入智能時代,群體的語言認同和文化認同意識將進一步增強,世界語言強弱格局和語言與文化的關係也可能重構。本文提出三條建議: 第一,加強語言認同和文化認同教育; 第二,提升國家通用語言文字與我國境內語言和方言的機器互譯能力; 第三,提升國家通用語言文字對中華民族現代文明的承載功能。這些舉措將有助於構建有中國特色的包容性、多元一體的語言認同和文化認同。

全文瀏覽_數智新時代的語言認同與文化認同  張璟瑋

提要:雙重否定結構是一種“通過兩次否定表示肯定意義”的特殊結構,直接影響自然語言處理中的語義判斷與情感分類。該文以“¬¬P==>P”為標準,對現代漢語中所有的“否定詞+否定詞”結構進行了遍曆研究,將雙重否定結構按照格式分為了3大類,25小類,常用雙重否定結構或構式132個。結合動詞的敘實性、否定焦點、語義否定與語用否定等理論,該文歸納了雙重否定結構的三大成立條件,並據此設計實現了基於規則的雙重否定結構自動識別程式。程式實驗的精確率為98.80%,召回率為98.90%,F1 值為98.85%。同時,程式還從96281句語料中獲得了8640句精確率約為99.20%的含有雙重否定結構的句子,為基於統計的深度學習模型提供了語料支持。

全文瀏覽_雙重否定結構自動識別研究  王昱、袁毓林

提要:新文科建設的目標之一是:多種學科在研究內容和理論方法上進行交叉與融合,從而形成新的學科方向、研究範式,以及相應的複合型人才培養模式。為此,本文提出一種可操作的路徑:利用已經發展起來的若干第一代交叉學科,融匯成第二代交叉學科。比如,對於“社交網路—語言的社會變異—計算建模”這種頭緒繁多的研究領域,可以借助“計算語言學”與“社會語言學”等第一代交叉學科,形成第二代交叉學科“計算社會語言學”。這種操作路線可以細化與落實新文科建設,並提供必要的學科規訓。文章還以當代社會的“物理—精神—資訊”三元空間,以及其中說話者的社會身份、個體人格和社交互動對語言使用和變異選擇的影響為例,闡明計算社會語言學的理論、方法和議題。

全文瀏覽_新文科視域下的計算社會語言學研究   袁毓林

提要:本文討論怎樣通過跟人類基線的比較,來合理地評估 ChatGPT 等現代大型語言模型的語言運用能力。首先,用代詞指稱歧義和否定轄域問題測試 ChatGPT,展示語言大模型在語義理解和常識推理方面的優秀表現;接著簡介維諾格拉德模式挑戰及其升級版本 WinoGrande數據集, 還介紹了我們對於這種類型的測試題和機器表現的評估方式的改進方案(把僅觸發詞不同的“句對”擴展為錨定詞也不同的“句偶”,把機器表現跟人類被試的表現進行比較);然後介紹我們怎樣用“句對”和“句偶”測試 ChatGPT和人類被試,並且把人類和機器的表現進行對比,從而得出語言大模型的語言運用能力接近人類的結論。

全文瀏覽語義理解與常識推理的機器表現和人類基線之比較——怎樣評估ChatGPT等大型語言模型的語言運用能力   袁毓林

Year 2023

提要:本文藉助語法化的擴展效應,考察了“非”自19世紀70年代以來發生類前綴化的具體過程。研究發現:最初是受到翻譯影響,在“X”與“非X”的特定對舉環境中,“非X”始可分析為詞匯性單位,“非”做詞根語素;伴隨“非X”的語義-語用環境、句法環境以及“非”的同構項“X”的類型的擴展,“非”的語義不斷泛化,內向依附性和能產性不斷增強,最終從“詞根語素”演變為“類前綴”。翻譯是“非”發生類前綴化的誘因;“對舉”的高頻使用以及“對舉項位置”的擴展是“非”類前綴化的核心環境和必要的實現手段;重新分析和類推分別是實現“非”類前綴化的首要機制和核心機制。本研究為探討漢語類詞綴的來源及形成問題提供了一種新的研究方法和路徑。

全文瀏覽《從語法化的擴展效應看近現代以來“非”類前綴化的過程及機制》

提要:移位元分析是語法理論處理和解釋異形同義句法格式間異同關係的基本手段和基本工具,移位元根據其發生的層面可以分為三類:明移、暗移和漂移。其中,明移發生於顯性句法結構的推導過程中,所見即所得;暗移發生於邏輯式層面,看似未動,實際已移;漂移發生在語音式層面,看似已動,實則未移。三類性質不同的移位元操作發生的語言層面不同,並且誘發動因和運行條件也各不相同。明移的誘發動因主要是為了滿足表層結構中句法條件的要求,暗移則是為了滿足邏輯式中某些特定的語義解釋條件,漂移的誘發動因既非表層句法條件,也不是邏輯式中的語義解釋要求,而是“急促”和“強調”兩大語用因素的共同驅動。本文通過對漢語中主謂結構倒裝句、狀中結構倒裝句和述補結構倒裝句等實際案例的分析,重在論述“漂移”並非僅僅是源自理論系統內部的抽象概念。在此理論體系和分析框架下,一系列重要的語序現象和語法案例將會得到重新整理和重新解釋。那些看似隨機偶然飄忽不定的靈活句法現象會得到圈定和限制,而這些案例的研究有助於發展和完善漂移理論本身,尤其是此種移位的性質定位、驅動因素和限制條件。

全文瀏覽《語序靈活性的限度和語音層飄逸的性質與條件》

提要:本文討論怎樣以真實的法庭審判語料為基礎,構建面向事實性表達研究的專題語料庫。文章指出,這種語料庫的標注應該聚焦于事實性構式的三種基本信息:事實、非事實和反事實,并從構式、語段、詞匯三個層次挖掘跟事實性信息相關的形式特征,最終形成了完整的標注體系和標注規范;進而采用BMES四元序列標注法,對這種語料進行事實性信息的標注。文章最后通過實例,展示了面向事實性信息的專題語料庫的進一步應用的可能性。 

全文瀏覽《怎樣構建面向事實性表達研究的法律專題語料庫》

提要:ChatGPT 等大語言模型在語義理解和常識推理方面表現優秀,其技術奧秘在於模型開發者在對詞語進行向量表示時,遵循分佈式語義學原理,採用了“嵌入”這種代數方法。但是,經典的測試語言運用等智慧水準的“圖靈測試”,難以識別欺騙和回避等作弊手段,因此,計算機科學家設計了“新圖靈測試”,其中的威諾格拉德模式挑戰與語言學關係密切。這一模式以代詞消歧為測試點設計句子對和問題,但是經過大規模語料訓練的語言模型可以憑藉詞彙上的統計相關性,而不是靠真正理解句子的意義來給出正確答案。為克服這一缺陷,學者們又發展出 WinoGrande 資料集,提高了資料的規模和難度,確保它們無法通過網路搜索等手段來得到正確答案。我們用威諾格拉德模式設計了無偏向雙重句子對測試 ChatGPT,展示了大語言模型在語義理解和常識推理方面已達到接近人類的水平。當然,從具身模擬假說來看,大語言模型不可能像人一樣富有體驗性地理解人類自然語言。最後,我們呼籲:語言學家應該積極參與構建 WinoGrade 測試集之類的工作,在人工智能時代擴展自身的學術研究領域。

全文瀏覽如何測試ChatGPT的語義理解与常識推理水平——兼談大語言模型時代語言學的挑戰与機會_袁毓林

提要:處於語言接觸地帶的惠東閩語在持續體貌形式與標記上展現多層疊置特徵。論文運用語言接觸、層次分析的理論與方法,描寫惠東閩語複雜的持續體貌形式,並論證這些形式源於與惠東閩語歷史來源、地理分佈關係密切的閩、客方言。惠東閩語持續體貌形式與標記的多層分佈狀態對與其同處接觸地帶的漢語方言具有類型意義。論文亦為層次分析法作用於語法研究提供個案參考。

全文瀏覽_層次疊置的語法表現——以惠東閩語持續體貌特徵爲例  徐宇航

提要:本文首先说明 ChatGPT 是一个通用的自然语言处理平台, 是走向通用人工智能的基石, 可以成为人工智能生成内容的开发平台。 然后, 从算法模型(生成式预训练+微调)、 指令微调(在上下文中学习和思维链等提示策略)、 跟人对齐(基于人类反馈的强化学习) 等角度, 介绍 ChatGPT 的技术原理和工程构架,以及人工智能专家和语言学家对它的批评意见。 最后, 介绍 ChatGPT 研发的缘起和 GPT⁃4 所达到的心智理论水平, 特别介绍心理语言学家对于 ChatGPT 的语言运用能力的测验, 介绍他们检验大型语言模型和人类在语言预测方面相似性的有关实验, 演示一种新兴的语言学实验范式。

全文瀏覽超越聊天機器人,走向通用人工智能——ChatGPT的成功之道及其對語言學的啓示_袁毓林

提要:目前我國城市化進入“城鄉一體化”的新階段,為了探索我國城市化新階段城鄉複雜的語言變異情況,本研究利用“快速匿名調查法”,以“德州”一詞為目標詞,對德州市區、縣城、鄉村(ei)變項的共時分布情況展開調查。方差分析顯示:年齡,空間,空間和年齡之間的交互作用以及空間和性別之間的交互作用具有顯著的制約效應。性別因素在德州城鄉之間具有不同的作用模式,在市區和縣城,性別差異並不顯著;在鄉村,女性相比男性會使用更多的本土變式,這與西方性別標準模型相反。前者是由我國國情下兩性相對平等的社會地位決定的,後者則與德州鄉村在城市化過程中出現的“男人進城務工,女人留守看家”的家庭分工模式相關。

全文瀏覽城鄉性別作用模式的差異——以德州話(ei)變項爲例

提要:本文引入語言多聲性和論辯性等觀念,來研究副詞“並”的語義功能和歷史來源。首先,確認“並”是一個語言多聲性的標記,具有強制先設的語法功能和表示反駁的話語功能。然後,在轉折句序列中鎖定“並”的語義功能:表示預期與實際結果的反向並列和轉折關係。接 著,從“並”字句的話語分佈和資訊地位的角度,揭示“並”強調否定的語氣功能的實現條件。文章還從語義功能和話語變換的角度,追溯語氣副詞“並”來源於範圍副詞和關聯副詞這兩種可能的演變路徑,從“並”的多重歷史來源(“並、併、並”)和“並”的連接功能的語義包容性(並列、遞進、附加)方面,解釋了現代漢語“並”的意義和用法的複雜性的根源。

全文瀏覽_ 多聲性標記“並”的反向並列意義及其歷史來源   袁毓林

提要:經典觀點認為否定不影響預設,即預設可以投射; 袁毓林( 2000) 卻發現有些情況下否定可以改變預設,這類預設跟焦點有關。通過形式語義分析,我們發現在標示一個句子焦點的同時,就預設了使得句子對應命題為真的焦點存在。本文把這類預設稱為“焦點存在性預設”,簡稱“焦點預設”。焦點預設和否定的關係與資訊結構密切相關: 背景內的否定必然改變焦點預設; 焦點內的否定不影響焦點預設。焦點預設雖受背景內否定影響,但其投射性不變,原因在於測試命題預設投射性的否定必須是命題外部的否定。本研究顯示資訊結構對於形式語義學研究具有重要意義。

全文瀏覽_論焦點預設  張帆、徐杰

提要:當今以深度學習為核心的人工智慧催生了科學研究的第五範式,本文呼籲,語言學研究也要擁抱數據 / 計算密集型的第四 / 五範式,並通過介紹和評論人工智慧研究與技術開發過程中,有關專家對於跟語言學有關的問題的見解,來支持上述倡議。本文主張或贊成的主要觀點為:(1)語言的主要功用是交際,思考往往是內心的對話與問答。(2)語言和思維並不完全等同,基於語言運用的智能水準的圖靈測試並不完全有效。(3)語法這種智能並不是人類獨有的,語法的原理還適用於語言之外的軀體、物品及其圖像等組合性系統。(4)現有能力超強的大規模語言模型不能用作人與機器人交談的技術界面,有效的語言運用必須是一種具身智能,包括具身認知的詞語接地和環境可供性等內容;相應地,必須考慮不同類型的具身性圖靈測試。(5)ChatGPT 的成功說明了大模型、大數據和強算力能夠捕獲語言的統計規律和運用模式,語言學要採用數據 / 計算密集型的第四 / 五範式來探索語言的統計結構。

全文瀏覽_人工智能大飛躍背景下的語言學理論思考  袁毓林

提要:日語示證標記「ミタイ」源於近世後期產生的「ヲミタヨウ」結構,後者經過賓格標記脫落和語音消蝕,1880年前後出現「ミタイ」形式。之後,兩者並用幾十年,直到20世紀40年代「ミタイ」完全取代「ヲミタヨウ」。20世紀30年代「ミタイ」由〈比喻〉發展出以〈推知〉為主的示證功能以及〈委婉〉功能。「ミタイ」示證功能的獲得過程在形式方面違背語法化單向性假說,在功能方面則符合主觀化的特徵。「ミタイ」在20世紀後期又衍生出表示〈附和〉的獨立用法並表現出體現韻律獨立的音高重音變化傾向。

全文瀏覽_日語示證標記「ミタイ」的誕生與發展  楊文江

提要:陝北神木話的引語結構“吼是”及其種種變式可以引入間接引語,並且隨著“說吼是”的功能泛化而進一步語法化為准標句詞。在標句詞理論框架下審視此種現象,我們認為“吼是”是一個引入賓語從句的准標句詞。它既有一般標句詞的共性特點,又有鮮明的個性特徵。典型的標句詞均有以下三項基元特徵:標明句子是主句還是從句,是定式句還是不定式句,句子的功能類型為何;而“吼是”僅有標明句子從句一項特徵,應跟漢語方言中其他源自言說動詞的標句詞一起看作准標句詞,從而跟典型標句詞有所區隔。本文認為,在標句詞理論框架下對“吼是”及同類詞語加以系統考察,對於深入認識其性質和特點以及標句詞理論的豐富和發展均有重要意義。

全文瀏覽_陝北神木話“吼是”類詞語的語法特徵與標句詞理論  邢向東、徐杰

提要:本文把朱德熙先生對於漢語語法學的原創性貢獻概括為:他創造出了打上自己烙印的概念和方法。文章參考陸儉明(1993),說明朱先生首創的“黏合與組合”“指稱與陳述”“自指與轉指”等概念、朱先生淬煉的“詞類是語法功能類”“漢語詞類的多功能性”“漢語語法的片語本位觀”“顯性與隱性語法關係”等觀念、朱先生提出的“變換和語義特徵分析”“共時與歷時和通語與方言相結合”等研究方法,怎樣特色鮮明地揭示了漢語的結構規律和語法面貌,引導大家一起大大地推進了漢語語法學的向前發展。

全文瀏覽他創造出了打上自己烙印的概念和方法——解析朱德熙先生對於漢語語法學的獨創性貢獻_袁毓林

提要:《平仄編》(Pʻing-Tsê Pien, A New Edition of the Peking Syllabary)是威妥瑪《語言自邇集》的第三個附錄,共百餘頁,其內容與《語言自邇集》的正文沒有從屬關係,可以視作獨立的部分。 《平仄編》為當年的外國人學習漢語提供了極大的便利,今天看來,它在我們研究威妥瑪拼音系統、19 世紀後期北京話的語音特點、漢字的同音關係、異讀分佈等方面都很有價值。 文章對《平仄編》的體例及內容進行了梳理,探討了《平仄編》的寫作背景和版本沿革,梳理了其內容和體例,分析了其反映出來的音系特點,並總結了《平仄編》的重要價值。 該書對研究威妥瑪拼音系統的特點及其創制和發展有著重要意義,也為我們探索早期北京話的語音面貌及同音關係提供了寶貴的資料,值得學界更多的關注。

全文瀏覽_威妥瑪《平仄編》及其反映的早期北京話   艾溢芳、羅言發

提要:現代漢語中,趨向動詞“起”可以獨立做謂語,做動後補語,做動前成分。做動前成分時,“起”既是詞內成分,又承擔句法功能。“起”族辭彙是一個個位移事件的凝固,能挖掘更多“起”的句法語義特徵。漢語的“起”作為語素能實現從語素到詞、短語、句子的三級跨越,直接參與到句法配置中,四個層面一步到位。“位移事件表達”和“時空轉換”以及漢語詞法、句法配置的“貫通性”原理是“起”的句法語義系統的內在制約因素。

全文瀏覽現代漢語中“起”的句法語義系統新解:事件表達與時空轉換_範立珂、陳忠

提要:苗歌語言有時為了滿足韻律要求,可不受苗語語法規則的制約,在詞法和句法層面呈現出多種語法突破現象。 我們發現湘西苗歌中的語法突破現象雖然突破了湘西苗語的語法規則,但不是雜亂無章的,是有限度的。 苗歌研究的語言學意義體現在兩方面。 第一,苗歌中的“省略”和“錯位”等語法突破現象具有跨語言的共性。 對詩歌語言中語法突破現象的考察能讓我們更細緻地觀察到文體變異的成因。 第二,苗歌中所有的語法突破現象都能在某種語言中找到與之匹配的正常語法現象,這說明苗歌中的語法突破現象並沒有超出普遍語法所能容忍的限度。 民歌民謠類詩歌語言的研究為普遍語法理論提供了新的研究領域和研究視角。

全文瀏覽_湘西苗歌中的語言特區現象及其語言學意義  吳芳、劉鴻勇

Year 2022

提 要:普通話中“地上”與“地下”均可表 “地面上”義 。 已有研究認為只要目標物 “可俯視”,“地上”或 “地下”充當參照物時便可自由替換, 但這一結論解釋力不強。本文從空間認知角度進一步考察發現:“地上” 與 “地下” 的同義替換不僅受到 “目標物的髙度”的影響, 還受到“空間關系的類型” 的制約 ,其根源在於“地上”與 “地下” 自身的空間方位參照類型及所涉空間關系的認知過程截然不同。

全文下載:《從空間認知看“地上”與“地下”的同義替換》

摘要:該文首先介紹《動詞句法語義資訊詞典》的體系結構與理論背景;然後,介紹該詞典所區分的8種動詞小類及其定義;重點介紹該詞典為動詞所設置的22種語義角色及其定義,由這些語義角色的不同配置而造成的20來種句法格式及其例句,及其所考察的動詞的9種主要的語法功能及其對於該詞類的隸屬度;最後,給出該詞典的檢索系統的介面截圖,交代其相應的紙質版本的情況。

附件下載:(全文)《動詞句法語義資訊詞典》知識體系及其檢索介面

提要:民族共同語的詞彙規範工作難度高,問題多,爭議大,其根本原因在於沒有一個明確、合理、可操作的詞彙規範標準。在漢語快速國際化,寬鬆包容的語言觀逐漸成為學界共識的背景下,這一理論缺陷所造成的混亂與弊端愈加嚴重。基於民族共同語標準適度多元的理念,本文建議放棄“以北方話為基礎方言”這一不切實際的表述,將現行普通話定義中的詞彙標準微調為“以北京話詞彙為基礎詞彙”。北京話詞彙的基礎作用主要體現在共同語區域變體的詞彙與北京話之間具有很高的相互理解度。方言詞彙如要進入民族共同語,它首先要進入共同語的區域變體。而方言詞彙能否進入共同語的區域變體取決於相關方言詞彙是否跟區域變體中的既有詞彙系統契合(體系性),在共同語區域變體中是否穩定(穩定性),是否在詞彙方面可以跟北京話之間進行無障礙溝通(可理解性)。

附件下載:(全文)詞彙規範的標準問題與方言詞彙進入共同語的條件

袁 毓 林 原 著

朴 敏 浚 ⋅ 李 命 定 ⋅ 鄭 仁 貞 飜 譯

Construction and Application of Chinese Paratactic Grammar 2 – Semantic Activation and Default Inference Mechanism of Paratactic Grammar

附件下載:(全文) 의합(意合) 특징에 기반한 중국어 문법체계의 구축과 응용 (中)— 의합 문법의 의미 활성화와 기본값 추론 기

   要:本文考察漢語和日語願望表達中的事實性問題。我們發現,由於缺乏事實性標記,漢、日語的願望表達中都存在事實性模糊的問題,且兩種語言對此的解決策略相似:一方面,兩種語言都可以用情感表達來傳遞願望的反事實意義;另一方面,兩種語言都傾向於用條件願望句來表達反事實願望。這種使用條件句的偏好可能是反事實思維、語言特點等多種因素共同作用的結果

附件下載:(全文) 漢、日語中願望的事實性及其表達特點

   要:閩語的持續體貌表現形式及標記多與表處所的介詞結構有關,此為閩語學界公認的事實。然而,處於語言接觸地帶的海豐閩語「動作」、「狀態」、「事件」持續體貌卻分別由[to35]、[nin53]、[tsu22]三種不同標記表示。三種持續體貌標記形式特徵各異,狀態、事件持續體貌標記更是來源不明。本文運用語言接觸理論,通過比較論證,證明海豐閩語動作持續標記[to35]源於譜系一致,地緣關係密切的粤東潮汕閩語,狀態持續標記[nin53]則源於區域内接觸頻繁的客家話,事件持續標記 [tsu22]與廣東、海南聞語具有類型一致特徵,是閩語表處所介詞結構簡省的結果。海豐閩語持續體貌標記的特徵及來源,對與海豐聞語一樣處在多語多方言接觸地帶的漢語方言,具有類型學意義。

附件下載:(全文) 海豐閩語持續體貌標記的特徵與來源

   要:本文以 2019年 12月外交部發言人在例行記者會上的發言作為語料,對外交語言中的問句進行了多聲性分析。 分析發現,外交語言中的問句為話語帶來了複雜的多聲現象和豐富的語義隱涵。 這些不同的聲音有不同的來源,表達了不同的觀點;並且,依據一定的語用推理原則,明確地否定了其中某些觀點,從而肯定了相反的某些觀點。 正是這種多聲現象説明塑造了外交語言既禮貌又有力的風格。

附件下載:(全文從多聲性看外交語言中問句的語義隱涵及其推理機制

提  要:疑問範疇和否定範疇是語言中的兩大重要範疇,它們之間存在著密切的聯繫,主要表現在疑問和否定之間具有語義相通性。 這種相通性主要體現在非現實性、疑問詞與否定詞關係密切、允准否定極項和向下蘊涵等方面;並且,疑問本身就包含了一種隱性否定語義,這是疑問和否定相通的語義基礎。 當然,疑問和否定語義相通是有條件的,即反問是疑問與否定相通的橋樑,是促使疑問向否定轉化的關鍵環節。 這是因為,反問這種疑問的強化形式與否定在語義上具有高度的一致性,表現在:它們都是對某個預先假設的命題的否認或反駁,且都帶有語義確定性。 而驚異、懷疑分別是推動疑問向否定轉化的重要語義動因和心理機制。 簡言之,疑問和否定語義相通是反問、驚異和懷疑三者共同作用的結果。

附件下載:(全文疑問和否定的相通性及其條件與機制

 要:本文主要通過分析形容詞及其相關形式的意義特點,來解釋形容詞謂語句的完句性限制條件。 首先根據朱德熙(1956)的觀察提出若干問題作為本文的求解目標。 接著揭示性質形容詞的語義特點:表示性質的有無與極性的正反。 文章指出,這種雙重對立性意義,使得其語義結構中內置了強烈的對比性意義,進而要求出現在對比性語境中。 然後從程度語義學的角度,說明性質形容詞表示事物的有關屬性的程度的極性值,但其極性區間模糊等語義上的限定不足,使其單獨做謂語後造成了一種表達不足的語句形式,並從屬性量級的廣域與窄域等測量背景上解釋正反形容詞使用的一些不對稱現象。 最後從認知上解釋性質形容詞為什麼會有雙重對立性意義,說明屬性程度的概念結構對詞彙和語法的影響。

附件下載:(全文形容詞的極性程度意義及其完句性限制條件

 要:本文考察19世紀官話詞典《英華韻府歷階》的收詞情況。研究發現,《英華韻府歷階》在官話音系背景下收録了衆多粵、閩方言詞彙。這種粵、閩等南方方言詞彙收録現象在早期官話語料中具有類型意義,同時爲詞典編撰地區的方言多樣性面貌提供重要綫索,對區域方言史研究,具有重要價值。

附件下載:(全文)《英華韻府歷階》官話音系下粵、閩方言詞彙的收録__徐宇航

Year 2021

 要:本文通過評論Larson(1988)提出的雙賓結構的衍生機制,說明語殼結構及空動詞(或輕動詞)並不是語法理論的必要構件。首先討論雙賓結構的句法轄域與成分統制關係問題,說明代詞照應與否定轄域分析並不一定需要成分統制概念,還分析了他主張的與格結構的句法層次結構的人為性;接著指出他的“動詞提升”和“輕謂語提升”分析存在的問題;然後分析他用類似被動式衍生的過程來設想從與格結構到雙賓結構的衍生所帶來的問題,指出雙賓結構的被動式衍生在兩種賓格的指派上缺少根據;並且無法解釋真正的客事和與事被動式為什麼不從其假定的有關深層結構上直接衍生;還說明了與格結構和雙賓結構變換的不完全能產性,不能不訴諸其中謂語動詞的詞彙-語義特點;最後通過追蹤他對雙賓結構的深層結構的投射過程的設計,揭示其一層層繁複的語殼結構是由一開始設定了過於簡單而整齊的短語結構規則而造成的;特別指出其核心重新分析機制可以使本來及物性參差不齊的謂詞跟其新版X-階標(X-bar)理論上的及物謂詞的概念對齊,從而使得語殼結構在表面上能夠罩住各種複雜類型的動詞及其相應的語句結構。

附件下載:(全文袁毓林 徐 杰 双宾结构的句法分析与VP语壳结构理论析疑 

提  要: 語言中存在大量的不規則和例外現象,而對于這些特殊現象的處理一直是困擾學界的難題。相關文獻有的回避了對此現象的定性,有的只是重新表述問題,沒有從根本上解決問題。本文在國內外相關研究的基礎上重新定義了不規則語法現象的內涵與特點,主張將這些所謂的不合邏輯、不合常規語法規則但可以理解和接受的不規則語法現象進行整體打包和詞匯化處理,統一歸入”擴充的詞庫”中。這種詞匯化處理方案,不僅簡化了核心語法運算系統,而且解決了一般與個別、普遍規則與例外現象的關系問題,同時還符合兒童語言習得的客觀規律和自然語言處理的”大詞庫,小語法”的技術路線,具有重要的理論意義。 

附件下載:(全文)不規則語法現象的詞匯化處理方案及其意義