楊英銳:ChatGPT的認知和我對它的認知

日期:2023-03-27 11:32:12 作者:fuli 瀏覽: 查看評論 加入收藏


二、判定問題與“我不知道”

最近某日凌晨,我在一個數學家的群里發了一條看似無理的微信:“請教,在目前解析數論的語言和概念框架下,黎曼猜想是可判定的嗎?”結果有三位同仁用這個問題去問ChatGPT, 問的方法僅稍有差別,內容是一樣的。ChatGPT的回答竟然很不一樣。第一個回答屬于所答非所問,等于什么都沒說。第二個回答純屬胡扯。第三個回答顯示了預訓練的水平,概括地講了目前黎曼猜想的研究現狀,但并設有正面回答問題。這三種回答模式本身并不可怕,反而反映了人們在語言行為的不同表現,給人感覺似乎它不經意間通過了傳統的圖靈測試;因為,環顧左右而言他,不懂裝懂,瞎編亂造,或者按背過的知識點機械回答,這些都是人們語言行為有時出現的現象,不足為怪。

但真正令人擔心的是,ChatGPT似乎不會說:我不知道。我問的問題,實際上是一個涉及計算復雜性理論的非常難的問題,稱為判定問題。并不是在問在數學上如何解決黎曼猜想。兩者屬于不同的層次。正常人(包括相關領域的專家)的回答應該是,我不知道。“我不知道”或相近短語應該是相當靠前的高頻短語。一個不字或其近義詞應該占到了半邊天下。可見,不僅ChatGPT, 還有它的設計者,都還有很長的路要走。ChatGPT無心,在語言行文中顯得有些缺心眼兒可以理解。可是其設計者有心,應當感到焦慮才是。

三、ChatGPT與認知革命三學派

由1950年代開始的認知科學革命,產生了大致三個頗為不同的學派,即喬姆斯基與米勒的語言習得學派,吉布森與奈瑟的環境賦能學派,以及西蒙與紐沃計算學派。喬姆斯基學派當年又稱為哈佛學派。語言學派從語言習得的角度,區分了人們與生俱來的內在認知裝置(competencies,capacity)和后天的語言行為表現(performance, ability)。環境學派(后來又稱生態心理學)認為環境布滿各種結構,而人在與這些結構相互作用時被賦予(affordance) 了認知能力。計算學派強調計算機模擬的重要性,以設計各種認知與行為的計算架構為己任。不難看出,ChatGPT作為一個課題涵蓋了這三個學派的方方面面。

在一篇短文中提到這些,不是為了展開論述,而是為了提供一個路線圖示:如何考察ChatGPT的認知以及我們對它的認知。這和初識某人,想要做進一步了解,是一個意思。比如,上面第一小節是在喬姆斯基意義下,介紹ChatGPT的內在裝置與基本能力(competences,capacity), 第二節說的是其表現(performance)。至于說它有出息是指其技術進步,而說它是公眾人物,三位同仁不約而同地去問它同樣一個問題,是說其產生的社會影響。這種路線圖示可幫助我們區別什么是其技術進步,什么是其科學發展,什么是其社會影響,以及什么是其商業宣傳。人的時間精力和資源都是有限的甚至是稀缺的。所以,投入一件事情,就要考慮自己的機會成本。

四、以標準教育考試為例

1997-2000年,我在普林斯頓大學和美國教育考試服務中心(ETS) 同時做博士后。研究課題之一就是在普林斯頓大學心理系的推理實驗室為GRE和SAT測試考題相對難度。相當于對考題文本的經驗分析。其時,也正是ETS開始發展機考和機器閱卷(包括寫作)技術的初期。一道考題的相對難度,不僅涉及題目文本的表層結構,還要涉及其深層結構,例如推理結構和決策結構。結構化程度,比如排比句的遞進,也是判斷一篇文章寫作強度與論證力度的關鍵判據。

結構性為我們提供各種認知通道,也是知識成規模遷移的重要工具。結構化是思想語言的基本特征, 應該也是自由交流(Chatting)的題中應有之義。歷來,邏輯主義AI強在其結構性基礎,神經網絡AI強在其模塊化處理。有機會我想了解后者在結構化技術上的進展;例如,可以應用哥德爾算術化方法構造自指語句,從而加深對話層次,等等。俗話說,人無遠慮,必有近憂。

五、商業性認知與非商業性認知

其實,對于大多數人而言,ChatGPT只有工具性和應用性的意義。那么,什么是ChatGPT對于個體的工具性意義呢?塔斯基的不可定義性定理告訴我們,任何個體工具性真理是不可在個體工具性層面定義的,而只能在高于個體性和工具性兩者的層面來定義。這個課題的深入討論超出這篇短文的范圍。簡略而言,對于ChatGPT的認知方式和使用方法取決于ChatGPT本身的認知水平。但后者存在兩面性,即商業性和非商業性。區別兩者的標志之一,就是預訓練內容的公開與否。

在商業性假設下,預訓練內容是保密的。客戶在不清楚預訓練內容的生態環境下,就只能與ChatGPT博弈所謂“20問題游戲”。這個具有極大不確定性的博弈過程要由量子力學波函數來刻畫。沒有詳細的預訓練信息,客戶對ChatGPT的觀測只能是狄拉克意義下的微觀觀測,滿足測不準原理。

在非商業性假設下,預訓練內容是公開的,而且OpenAI有義務提供并不斷公布更新的預訓練具體內容。在這種情況下,客戶和ChatGPT處于信息對稱的狀態,后者就像牛頓所觀測到的自由落體蘋果,兩者的關系用一般的連續函數就能刻畫了。

對于前段時間聽到的元宇宙和最近聽到的ChatGPT,我們感受到的都是“大詞”,“網絡技術大革命”“人工智能大拐點”“廣泛應用大前景”“無限可能大市場”,等等。對此,我持開放心態,樂見其成并愿與其并肩前行。但同時,我感受到大資本的挾持,大商業的奴役,大浪潮的壟斷和大趨勢的無形。我只想弱弱地問一句站在ChatGPT背后的人,可能告訴我,您都預訓練了那“孩子”什么,明天早飯您準備給那“孩子”吃什么?也許,我還會多問一句,您知道什么是NP問題嗎?

責任編輯:

留言與評論(共有 0 條評論)
   
驗證碼: