0門檻克隆ChatGPT！30分鐘訓(xùn)完 60億參數(shù)性能堪比GPT-3.5

時間：2023-03-27 20:22:17

破解「CloseAI」，ChatGPT克隆羊問世！0門檻實現(xiàn)「自研」，從此大語言模型不再只是少數(shù)大公司的「金手指」。

此前，OpenAI不Open的事件，已經(jīng)引發(fā)了坊間的諸多爭議。

光放出基準和測試結(jié)果，不提供訓(xùn)練數(shù)據(jù)、成本、方法，是真的要「贏家通吃」了。

(資料圖片僅供參考)

眼看大語言模型似乎要被巨頭公司壟斷，如今忽然殺出一個初創(chuàng)公司，給了OpenAI一槍——用60億參數(shù)的「Dolly」實現(xiàn)了和ChatGPT相似的能力。

沒錯，我們現(xiàn)在只需要準備一些高質(zhì)量的訓(xùn)練數(shù)據(jù)，再隨便拿一個開源的大語言模型，訓(xùn)練30分鐘后，就能得到一個ChatGPT「平替」！

對此，Databricks自豪地表示，Dolly的發(fā)布，就是自己在人工智能技術(shù)民主化道路上打響的第一彈。

60億參數(shù)堪比ChatGPT，30分鐘就訓(xùn)好

由于ChatGPT需要消耗大量的數(shù)據(jù)和算力資源（利用數(shù)萬個單詞訓(xùn)練，消耗大量GPU），所以這類大語言模型注定只能被少量巨頭所掌握。

和「CloseAI」相反，Meta在今年3月向?qū)W術(shù)界發(fā)布了一組高質(zhì)量（但不是指令跟隨的）語言模型LLaMA，每個模型的訓(xùn)練時間超過了80,000個GPU小時。

隨后，斯坦福大學(xué)基于LLaMA構(gòu)建了Alpaca，但不同之處在于，它利用一個包含50,000個問題和答案的小數(shù)據(jù)集進行了微調(diào)。令人驚訝的是，這使得Alpaca具有了類似于ChatGPT的交互性。

而Dolly正是受到了Alpaca的啟發(fā)。

更有趣的是，擁有60億參數(shù)的Dolly并沒有利用現(xiàn)在最新的模型，而是選擇了一個2021年發(fā)布的開源模型——GPT-J。

由于Dolly本身是一個模型的「克隆」，所以團隊最終決定將其命名為「多莉」——有史以來第一個被克隆的動物。

與當前的大型語言模型（如GPT-3）相比，Dolly允許用戶使用更小、更專業(yè)的模型，「復(fù)刻」ChatGPT的能力。

畢竟對于那些細分用戶來說，能夠利用針對本行業(yè)進行過精調(diào)的模型，可以大大增加性能和準確性。

盡管Databricks與OpenAI并無直接競爭關(guān)系，但它似乎試圖通過證明構(gòu)建類似ChatGPT這樣的服務(wù)并非看起來那么困難，來搶占OpenAI的風頭。

尤其是，OpenAI采取了「規(guī)模越大越好」的方法來開發(fā)語言模型，并對其工作越來越保密。

而Databricks除了將Dolly作為開源軟件發(fā)布外，還強調(diào)Dolly只有60億個參數(shù)（在訓(xùn)練過程中微調(diào)的語言模型部分），OpenAI的GPT-3模型有1750億個參數(shù)。（OpenAI并未透露GPT-4的參數(shù)數(shù)量）。

讓老模型，涅槃重生

根據(jù)InstructGPT論文中描述的指令跟隨能力對Dolly進行評估后發(fā)現(xiàn)，它在很多能力上的表現(xiàn)和ChatGPT十分類似，包括文本生成、頭腦風暴和開放式問答。

在這些例子中，值得注意的不是生成文本的質(zhì)量，而是在一個小型的高質(zhì)量數(shù)據(jù)集上，微調(diào)一個舊的開源模型所帶來的指令跟隨能力的巨大改進。

內(nèi)容生成

比如，寫一條Databricks官宣大規(guī)模語言模型Dolly發(fā)布的推特。

可以看到，原始的60億參數(shù)模型（GPT-J）所生成的內(nèi)容驢唇不對馬嘴，而Dolly則給出了一個完全可用的推文——

不僅內(nèi)容符合要求，而且還貼心地加上了標簽，以及提醒你記得加入發(fā)布的鏈接。

對于這一題，ChatGPT給出的答案也是符合期待的，相比于Dolly，ChatGPT給出的推文包含更多評述性詞句，并且給出的標簽更加精準具體，但整體差距不大。

當要寫一條出售Nikon D-750相機的廣告時，可以看到，GPT-J所生成的內(nèi)容基本就在胡編亂造，像是在寫小說一樣杜撰購買和出售相機的劇情……

而Dolly則根據(jù)Nikon D-750相機的特點及優(yōu)勢，給出了一則吸引人的相機轉(zhuǎn)賣廣告語，但遺憾的是像素參數(shù)不對。

ChatGPT在這一題上也是圓滿完成任務(wù)，廣告語中突出該款相機的優(yōu)勢，文末仍然貼心地加上了標簽。

最后一題：給Edgar Allan Poe（愛倫·坡）寫一封情書。

對此，古早的GPT-J直接拒絕回答，究其原因竟然是——愛倫·坡已經(jīng)去世了，你不能給私人寫情書。

而Dolly則成功地完成了任務(wù)，效果對比起來堪稱「涅槃」。

而這種「創(chuàng)造性」問題，顯然是ChatGPT的強項，洋洋灑灑地寫了300多個字。

開放問答

在事實性問題的問答測試上，團隊選擇了下面這個：「向我解釋一下核裂變和核聚變之間的區(qū)別?！?/p>

先不管對錯，GPT-J全篇都是在講太陽如何如何，雖然提到了「聚變」這個詞，但完全無視了「裂變」。

而Dolly第一句就直接點題——核裂變和核聚變的區(qū)別在于釋放能量的方式，隨后簡單解釋了他們的不同。

相比之下，ChatGPT給出的回答明顯要更加翔實。

頭腦風暴

當讓它們頭腦風暴，給出應(yīng)該閱讀的五本科幻小說的名單，GPT-J則只是在喃喃自語，像是沉浸在了拖延閱讀而產(chǎn)生的愧疚情緒中，完全回避了這個提問。

Dolly則一如既往的表現(xiàn)穩(wěn)定，按照指令給出了5本科幻小說的書名及其作者。

ChatGPT對于該問題給出了更加豐富的回答，不僅包括書名和作者，還對每一本書的內(nèi)容、類型作了簡要評述和介紹。

你要Close，我就Open

對于很多公司而言，寧愿自己建立一個不那么強的模型，也不愿將數(shù)據(jù)發(fā)送給那些只提供API的大語言模型供應(yīng)商。

其中一個重要原因便是，這些問題和數(shù)據(jù)集是公司最敏感和專有的知識產(chǎn)權(quán)，直接將其交給第三方顯然是不靠譜的。

此外，公司自身可能在模型質(zhì)量、成本和期望行為方面有不同的權(quán)衡，一種可定制化的語言模型更加符合需求。

現(xiàn)在，Dolly的發(fā)布給了他們希望——即便是一個「過時」的開源大型語言模型 (LLM)，也能通過30分的訓(xùn)練，賦予它神奇的類似ChatGPT的指令跟隨能力。

不難想象，大語言模型或許很快就不是AI巨頭公司獨占的玩法了！

正如公司CEO Ali Ghodsi所說，「我們的信念是，讓全世界的每個組織都能利用這些技術(shù)。」

關(guān)鍵詞：

延伸閱讀:

火速變現(xiàn) 微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權(quán) 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環(huán)球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業(yè) 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現(xiàn)在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業(yè)務(wù)場景融合價值潛力大 2023-03-29

版權(quán)聲明：
凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品，版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有，未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明"來源：網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責任。
除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外，其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學(xué)好語文就選科大訊飛AI翻譯筆，多重使...
三個月內(nèi)突圍而出，TVB識貨618告捷: GM...
玩轉(zhuǎn)穗澳特色就在琶洲！2023澳門·廣州...
玩轉(zhuǎn)穗澳特色就在琶洲！2023澳門·廣州...
環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科...
環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關(guān)于深圳...
深圳中國國際旅行社有限公司（關(guān)于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經(jīng)濟新機遇丨綜述：中荷經(jīng)貿(mào)人...
共話中國經(jīng)濟新機遇丨綜述：中荷經(jīng)貿(mào)人...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關(guān)于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結(jié)，就是力量！
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數(shù)量全國排...
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數(shù)量全國排...
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
欠了信用卡11年沒還，不還產(chǎn)生什么后果_...
欠了信用卡11年沒還，不還產(chǎn)生什么后果_...
天天精選！小區(qū)便利店怎么選擇位置
我的世界自動門感應(yīng)門（我的世界自動感...
我的世界自動門感應(yīng)門（我的世界自動感...
她曾經(jīng)在23歲時走紅，卻被身高限制戲路...
她曾經(jīng)在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養(yǎng)權(quán)怎么判
頭條焦點：離婚二審撫養(yǎng)權(quán)怎么判
世界最新：杭州民辦東方中學(xué)教師待遇_杭...
世界最新：杭州民辦東方中學(xué)教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
世界動態(tài):首屆京津冀生態(tài)產(chǎn)業(yè)創(chuàng)新發(fā)展大...
世界報道:運動員該如何應(yīng)對“飯圈文化”...
世界報道:運動員該如何應(yīng)對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區(qū)服務(wù)
港交所紐約辦事處開幕　提升北美地區(qū)服務(wù)
韓媒：韓國環(huán)境部已批準“薩德”基地環(huán)...
看圖學(xué)習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
看圖學(xué)習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
天天新動態(tài)：三亞22日10時起發(fā)放一批旅...
呂梁市“三夏”麥收安排調(diào)度會要求：顆...
呂梁市“三夏”麥收安排調(diào)度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監(jiān)察機關(guān)統(tǒng)籌用好基層監(jiān)督力量精...
紀檢監(jiān)察機關(guān)統(tǒng)籌用好基層監(jiān)督力量精...
總投資約36億元，惠州新材料產(chǎn)業(yè)園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內(nèi)上市新款榮威i5官圖發(fā)布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構(gòu)建和諧勞動...
【天天播資訊】琿春市積極構(gòu)建和諧勞動...
三終端上人難，邀約棘手。
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環(huán)球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區(qū)別_近親屬|(zhì)當前看點
近親屬和親屬的區(qū)別_近親屬|(zhì)當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學(xué)地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數(shù)解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉(zhuǎn)快應(yīng)用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關(guān)掉？oppo手機老
· oppo手機開發(fā)者選項在哪里能打開？oppo手機

熱文

環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科收費高嗎排名公開
證監(jiān)會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關(guān)于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
欠了信用卡11年沒還，不還產(chǎn)生什么后果_全球最資訊
她曾經(jīng)在23歲時走紅，卻被身高限制戲路，老公也是優(yōu)秀的演員！|每日熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱

中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像