中美AI邊個勁? ChatGPT夠全面 文心一言這點更優勝

社會熱點

發布時間: 2023/03/24 17:00

最後更新: 2023/03/24 17:33

分享:

分享:

中美科技巨頭在人工智能(AI)領域短兵相接,繼美國AI聊天機械人ChatGPT推出升級版「GPT-4」,中國百度亦發表「文心一言」,並支援文字生成圖片功能。內地科技網站分別就文學、哲學、邏輯推理等方面出題,對比兩個聊天機械人誰更勝一籌,並發現雙方都有優勝之處。

點擊圖片放大
+4
+3

文學和創作上各有千秋

在文學創作方面,回答「寫一本像奧斯丁《傲慢與偏見》同類型小說的大綱」時,ChatGPT的答案沒有完全脫離原著,並提煉到核心要點,即「階級問題」。文心一言的優勢則是,理解到同類型小說,還提出另外一段愛情故事的大綱;但該回答也僅限於愛情故事,沒有呈現《傲慢與偏見》中的階級差異。

點擊圖片放大

在商業文案創作上,針對「為具備川菜風味的中式餐廳取名並且寫宣傳語」的提問,ChatGPT提出「麻辣香坊」的餐廳名,並寫了廣告詞。文心一言沒有寫出廣告詞,但取名的方向則更貼近生活,並提供多個選項,如「川香閣」、「川味道」等。

點擊圖片放大

邏輯推理和寫代碼ChatGPT更勝一籌

為測試推理能力,內媒要求兩大人工智能辯證「如果貓會爬樹,那麼狗也會。」ChatGPT的回答更勝一籌,認為這個邏輯題本身有問題,關鍵點在於,貓狗不是同一物種。而文心一言卻陷入邏輯錯誤中,或者說,並沒有完全理解題目意思。

點擊圖片放大

在寫代碼方面,詢問「x+2=5,y-3=7,輸出x+y等於幾,用java做一個簡單程式設計。」得出結果後詢問專業人員,文心一言生成的代碼和最後得出來的結果均出現問題,ChatGPT則提供了正確的答案。

點擊圖片放大

對於理解哲學問題,「闡述你對『無限』和『有限』這兩個概念的理解,並解釋為什麼有時候我們會覺得自己的生命有限。」ChatGPT和文心一言的回答都沒有什麼邏輯問題,並且對兩個詞做出書面解釋。不過,文心一言則更注重「理論」,並且提出這是一個哲學問題。

提問的方式、角度、限定詞影響結果

另外,在生成速度上,文心一言遙遙領先,在300至500字左右的生成速度是14秒左右;而ChatGPT即使排除網絡等問題,生成同樣字數的問題至少超過30秒時間。在中文語義理解能力上,文心一言的的確是比較突出。

但值得注意的是,每一次的提問,生成的答案都不相同。此外,提問的方式、角度、限定詞也會影響答案的輸出,並不是每一個答案都是充分正確,兩個模型也會輸出並不完全正確的內容,或者是「一本正經講廢話」。

責任編輯:陳俊賢

開啟hket App,閱讀全文
訂閱《香港經濟日報》電郵通訊
收取第一手財經新聞資訊 了解更多投資理財知識 提交代表本人同意收取香港經濟日報集團所發出的推廣訊息,你也可以查閱本網站的私隱政策使用條款
訂閱《香港經濟日報》電郵通訊
收取第一手財經新聞資訊 了解更多投資理財知識 提交代表本人同意收取香港經濟日報集團所發出的推廣訊息,你也可以查閱本網站的私隱政策使用條款