網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
當(dāng)前最新:ChatGPT的智能還不如貓狗?
時(shí)間:2023-02-15 11:08:34

對(duì)話式人工智能(AI)正受到廣泛關(guān)注。在網(wǎng)站上向AI提問(wèn)時(shí),它會(huì)像真人寫的一樣用自然的語(yǔ)句做出回答。由于美國(guó)谷歌和微軟等大型科技企業(yè)參與相關(guān)競(jìng)爭(zhēng),這更吸引著全球熱切的目光。

但是,直至目前公開(kāi)的對(duì)話AI仍存在嚴(yán)重缺陷。雖然是由AI讀取大量數(shù)據(jù),可以給出像模像樣的答案,但也存在很多致命性錯(cuò)誤。很難說(shuō)AI真正理解了問(wèn)題和自己用于作答的詞匯的“含義”。

通過(guò)梳理“ChatGPT”等對(duì)話AI出現(xiàn)的諸多錯(cuò)誤,就可以發(fā)現(xiàn)機(jī)器要達(dá)到真正的智能所面臨的核心技術(shù)課題。


(資料圖)

“老師”和“親媽”將展開(kāi)競(jìng)爭(zhēng)

由于2022年秋季美國(guó)初創(chuàng)企業(yè)OpenAI免費(fèi)公開(kāi)的ChatGPT在全世界引發(fā)熱議,此前一直不打算向公眾公開(kāi)對(duì)話AI的谷歌改變了方針。

2月6日,谷歌首席執(zhí)行官(CEO)桑德?tīng)?middot;皮查伊親自在官方博客上宣布,未來(lái)幾周內(nèi)將在搜索服務(wù)中嵌入名為“Bard”的對(duì)話AI并投入使用。

谷歌CEO桑德?tīng)?middot;皮查伊宣稱AI是谷歌最重要的技術(shù)領(lǐng)域(2022年10月,東京都澀谷區(qū))

據(jù)稱,在搜索欄中輸入提問(wèn)內(nèi)容后,會(huì)顯示用自然流暢的語(yǔ)句給出的答案,以及回答問(wèn)題時(shí)作為依據(jù)所參考的網(wǎng)頁(yè)鏈接。

事實(shí)上,領(lǐng)先一步的ChatGPT的基礎(chǔ)是基于AI的大型語(yǔ)言模型,該模型建立在谷歌開(kāi)發(fā)的被稱為“Transformer”的技術(shù)之上。不僅如此,谷歌還擁有數(shù)據(jù)量和能夠生成的句子類型數(shù)量遠(yuǎn)多于OpenAI的模型。對(duì)于OpenAI來(lái)說(shuō),谷歌公開(kāi)對(duì)話AI,就好比“老師”突然變成了競(jìng)爭(zhēng)對(duì)手。

在“老師”發(fā)布消息之后,“親媽”也跟著行動(dòng)起來(lái)。在谷歌宣布公開(kāi)對(duì)話AI的第二天(2月7日),OpenAI的大股東微軟也發(fā)布消息稱,在搜索服務(wù)必應(yīng)(Bing)中嵌入了基于OpenAI技術(shù)的對(duì)話功能。據(jù)稱,通過(guò)與搜索功能同時(shí)使用,可以根據(jù)最新信息以自然流暢的語(yǔ)句做出回答,還能夠?qū)﹂L(zhǎng)達(dá)好幾頁(yè)的文檔進(jìn)行概括提煉。

不善于追逐最新信息

谷歌和微軟都強(qiáng)調(diào),通過(guò)同時(shí)使用搜索和生成自然語(yǔ)言的功能,可以根據(jù)網(wǎng)上的最新信息生成語(yǔ)句。反過(guò)來(lái)說(shuō),對(duì)話AI此前一直不擅長(zhǎng)追逐最新信息。

ChatGPT等的大型語(yǔ)言模型,每次更新信息內(nèi)容時(shí),都需要重新讀取數(shù)量龐大的文獻(xiàn)數(shù)據(jù)。因?yàn)楹茈y頻繁更新,所以模型內(nèi)保存的信息大多比較舊。

比如,當(dāng)詢問(wèn)ChatGPT“洛杉磯湖人隊(duì)(Los Angeles Lakers)最近一場(chǎng)比賽的上場(chǎng)陣容”時(shí),得到的回答是“我只具備2021年之前的知識(shí),無(wú)法回答您的問(wèn)題”。

谷歌和微軟的對(duì)話AI同時(shí)使用網(wǎng)絡(luò)搜索,因此會(huì)在信息的同步性和準(zhǔn)確性方面取得巨大進(jìn)步。盡管如此,谷歌在2月8日進(jìn)行Bard的演示時(shí),仍顯示出了錯(cuò)誤信息,說(shuō)是美國(guó)航空航天局(NASA)的詹姆斯韋伯太空望遠(yuǎn)鏡成功拍攝到了史上第一張?zhí)?yáng)系外行星的照片。這一錯(cuò)誤信息隨后引發(fā)爭(zhēng)議??梢?jiàn),信息的準(zhǔn)確性仍有不少課題需要解決。

缺乏常識(shí)和邏輯

除了上述的問(wèn)題外,對(duì)話AI還存在根本性的課題。目前推出的對(duì)話AI基本上都很難說(shuō)已經(jīng)可以理解自己所使用的詞匯的概念、含義、事物或現(xiàn)象的因果關(guān)系等“邏輯”。正因?yàn)槿绱?,才?huì)反復(fù)出現(xiàn)簡(jiǎn)單的事實(shí)誤認(rèn)。

例如,向ChatGPT詢問(wèn)“哥哥和姐姐有什么不同”時(shí),得到的回答是“雖然兄弟姐妹關(guān)系因家庭結(jié)構(gòu)和出生順序不同而存在差異,但哥哥通常比姐姐年齡大”。之所以給出這樣不知所以然的答案,是因?yàn)闆](méi)有“理解”哥哥、姐姐等詞語(yǔ)的概念、相互之間的關(guān)系、家庭構(gòu)成等全局情況。

向ChatGPT詢問(wèn)“哥哥”和“姐姐”的區(qū)別時(shí),得到的回答含有錯(cuò)誤內(nèi)容

之所以會(huì)出現(xiàn)這樣的錯(cuò)誤,是因?yàn)楝F(xiàn)在使用的絕大部分語(yǔ)言模型是機(jī)器學(xué)習(xí)型AI。因此,使用的語(yǔ)言基本上是單詞和短語(yǔ)的“排列”,機(jī)器通過(guò)讀入數(shù)量龐大的過(guò)去的文獻(xiàn)來(lái)識(shí)別排列類型。然后再計(jì)算出各類型出現(xiàn)的概率,尋找出接在問(wèn)題之后的概率較高的字符串并加以顯示。

例如,在日語(yǔ)語(yǔ)言模型中輸入“我が輩(中文譯:我)”,使其生成后續(xù)的語(yǔ)句時(shí),答案就會(huì)顯示在書籍、新聞報(bào)道、網(wǎng)站留言中出現(xiàn)概率最高的排列組合類型,即“は貓である(中文譯:是貓)”(見(jiàn)下圖)。ChatGPT還可以直接生成與“夏目漱石風(fēng)格”的小說(shuō)相類似的句子。

(編者注:《我が輩は貓である》是日本作家夏目漱石的長(zhǎng)篇代表作,中文譯名為《我是貓》)

語(yǔ)言模型是“學(xué)習(xí)”在基本單詞之后銜接什么單詞的概率,并生成句子。(資料由NTT數(shù)據(jù)尖端技術(shù)提供)

簡(jiǎn)單計(jì)算也會(huì)出錯(cuò)

也就是說(shuō),聊天AI不過(guò)是根據(jù)讀取數(shù)據(jù)找出概率高的詞序,并不是理解單詞、語(yǔ)句的“含義”以及家庭成員之間的關(guān)系等“常識(shí)”。因此,它不擅長(zhǎng)回答那些不理解意義和常識(shí)就難以回答的問(wèn)題。

由于不擅長(zhǎng)邏輯,因此Chat GPT也不擅長(zhǎng)簡(jiǎn)單的計(jì)算。讓它做任意4位數(shù)之間的乘法,大都會(huì)算錯(cuò),并且反復(fù)輸入相同算式時(shí),總是給出錯(cuò)誤的答案。

讓ChatGPT計(jì)算4567×5678的乘法,會(huì)給出錯(cuò)誤的答案。大規(guī)模語(yǔ)言模型不擅長(zhǎng)世上文獻(xiàn)很少的小學(xué)生水平的數(shù)學(xué)。

也就是說(shuō),現(xiàn)有的聊天AI不適合用于調(diào)查事實(shí)。而應(yīng)該僅限于在不管內(nèi)容的真實(shí)性和準(zhǔn)確性,只需要自動(dòng)生成自然語(yǔ)句和軟件程序等文字列的目的時(shí)使用。

機(jī)器學(xué)習(xí)的極限和下一個(gè)AI

那么,擁有與人類相當(dāng)?shù)摹爸悄堋钡腁I的開(kāi)發(fā)到底有沒(méi)有取得進(jìn)展呢?熟悉日本國(guó)內(nèi)外動(dòng)向的日本科學(xué)技術(shù)振興機(jī)構(gòu)研究開(kāi)發(fā)戰(zhàn)略中心的研究員福島俊一表示:“具有邏輯思考、常識(shí)和認(rèn)知的新一代AI的研究從幾年前就在推進(jìn)”。

AI掀起過(guò)3次新技術(shù)浪潮。分別是1960年代、1980年代及從2010年代持續(xù)至今的第三次。其中,1960年代和1980年代是計(jì)算機(jī)根據(jù)人類預(yù)先編制好的邏輯,分析數(shù)據(jù)得出結(jié)論。由此也發(fā)現(xiàn)編制支持現(xiàn)實(shí)的無(wú)數(shù)邏輯不太可能,于是上一波浪潮在1990年代開(kāi)始走向衰退。

2010年代開(kāi)始、持續(xù)到現(xiàn)在的AI浪潮并不是人類思考邏輯,而是由讓計(jì)算機(jī)自己歸納出數(shù)據(jù)的各種類型的機(jī)器學(xué)習(xí)來(lái)引領(lǐng)。隨著相當(dāng)于計(jì)算機(jī)大腦的半導(dǎo)體性能越來(lái)越高以及互聯(lián)網(wǎng)普及,可以收集全世界的數(shù)據(jù),被稱為“深層學(xué)習(xí)”的可以識(shí)別復(fù)雜類型的軟件技術(shù)問(wèn)世等要素全部得以實(shí)現(xiàn)。

如果將機(jī)器學(xué)習(xí)型AI和“大數(shù)據(jù)”結(jié)合起來(lái),限定于特定用途,就可以完成人類不可能完成的工作。比如,通過(guò)讀取大量的面部照片,提高圖形識(shí)別能力,從而實(shí)現(xiàn)智能手機(jī)開(kāi)機(jī)時(shí)的面容解鎖。

Digital Garage董事伊藤穰一指出了依賴機(jī)器學(xué)習(xí)的AI的“極限”

不過(guò),要實(shí)現(xiàn)自動(dòng)駕駛及自律型多功能機(jī)器人,相當(dāng)于頭腦的AI要具有識(shí)別眼前物體和周圍情況的能力,其中包括過(guò)去沒(méi)經(jīng)歷過(guò)的情況。

這需要基于邏輯和常識(shí)的推論能力,僅靠依賴“過(guò)去”事例的機(jī)器學(xué)習(xí)型模型并不能順利實(shí)現(xiàn)。熟悉尖端技術(shù)動(dòng)向的Digital Garage公司董事伊藤穰一指出:“谷歌、特斯拉及蘋果仍很難將自動(dòng)駕駛汽車推向?qū)嵱谜f(shuō)明依靠機(jī)器學(xué)習(xí)的AI存在極限”。

“別說(shuō)人類,就連貓狗的智能都遠(yuǎn)未達(dá)到”

對(duì)話型AI缺乏“常識(shí)”和“道理”也源于根據(jù)數(shù)據(jù)以歸納法方式探索相關(guān)類型的機(jī)器學(xué)習(xí)型AI的弱點(diǎn)。

兼具常識(shí)和邏輯思考的新一代AI如何才能實(shí)現(xiàn)?參考人類兒童自然掌握語(yǔ)言、空間認(rèn)識(shí)及社會(huì)關(guān)系等的過(guò)程,讓計(jì)算機(jī)學(xué)習(xí)邏輯和常識(shí)的研究正以腦科學(xué)家和認(rèn)知科學(xué)家也參與的跨學(xué)科途徑推進(jìn)。另外,也有將在第2次AI浪潮下失敗的人類輸入邏輯和常識(shí)與尖端的深層學(xué)習(xí)相融合的嘗試。

關(guān)于通過(guò)機(jī)器實(shí)現(xiàn)與人類接近的智能這一長(zhǎng)期目標(biāo)與現(xiàn)有AI技術(shù)的差距,開(kāi)拓深層學(xué)習(xí)基本技術(shù)的美國(guó)Meta首席AI科學(xué)家、紐約大學(xué)教授Yann Lucan形容道:“目前先別說(shuō)人類,就連貓狗的智能都遠(yuǎn)未達(dá)到”。

我們不能因?yàn)榭吹綄?duì)話AI的流暢文章就誤以為AI智能已經(jīng)接近超越人類的“特異功能”(Singularity)。人類的科學(xué)技術(shù)在達(dá)到這一水平之前還需要實(shí)現(xiàn)眾多突破。

本文作者為日本經(jīng)濟(jì)新聞 編輯委員 小柳建彥

關(guān)鍵詞: chatgpt

版權(quán)聲明:
    凡注明來(lái)網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來(lái)源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來(lái)源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
 

中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號(hào):京ICP備2022016840號(hào)-15

營(yíng)業(yè)執(zhí)照公示信息