“那些倒賣ChatGPT使用方法的人,有的都賺走上百萬元了?!苯诘囊粓?chǎng)活動(dòng)上,一位資深媒體人為AIGC(人工智能生成內(nèi)容)熱度發(fā)出這般感嘆。
如果說柯潔對(duì)戰(zhàn)AlphaGo讓公眾小小地感受了一番AI震撼,那么2022年下半年以來,自ChatGPT和Stable Diffusion掀起的AIGC浪潮,則是令主流互聯(lián)網(wǎng)用戶都感受到了AI技術(shù)有機(jī)會(huì)帶來的革命。在無數(shù)寓言和長(zhǎng)達(dá)數(shù)十年的研究投入后,AI終于要在更大范圍改變世界。
(圖源:ChatGPT)
(資料圖片)
通過對(duì)話式AI交互界面ChatGPT,人們可以很輕松地獲得像人類一樣思考后產(chǎn)出的內(nèi)容,小到一段對(duì)話一則公式,大到完整程序代碼和正式應(yīng)用文。Stable Diffusion把已經(jīng)頗受關(guān)注的AI圖像生成技術(shù)更進(jìn)一步,只需要做出描述,就能以較高的精度和質(zhì)量生成對(duì)應(yīng)畫面。
AI生成內(nèi)容的效率遠(yuǎn)超人類,引發(fā)了一系列懷疑和討論,但無論是那一方都不會(huì)否認(rèn)的是,AI技術(shù)正在快速成長(zhǎng)并影響到更多的人和事。
“許愿機(jī)”更精準(zhǔn)更高效
雖然伴隨著相當(dāng)巨大的訓(xùn)練成本,也絲毫不影響大語言模型被業(yè)界視作實(shí)現(xiàn)對(duì)話式AI的有效路徑,Google等頂級(jí)科技企業(yè)均有進(jìn)行相關(guān)研發(fā)投入。OpenAI公司基于GPT 3.5模型打造的ChatGPT,一下子展現(xiàn)出了AI在內(nèi)容生成方面的巨大潛力,有望代替大量機(jī)械的重復(fù)勞動(dòng)。
該產(chǎn)品能通過對(duì)話和即時(shí)獲取信息,快速針對(duì)用戶要求給出幾乎有求必應(yīng)的回答,即使仍存在準(zhǔn)確率問題,但展現(xiàn)出來的邏輯性足以媲美人類。濫用AI卻削弱了人腦訓(xùn)練的擔(dān)憂顯現(xiàn)出來,國(guó)外部分高校已經(jīng)發(fā)文要求不能使用ChatGPT完成論文,必須經(jīng)過學(xué)生自主思考輸出。
(圖片來自:ChatGPT)
ChatGPT有著一定使用門檻,而微軟基于背后技術(shù)打造的New Bing,讓更大范圍的人群體驗(yàn)到對(duì)話式AI有多么“可怕”。目前已有部分注冊(cè)用戶可用,該產(chǎn)品能給到邏輯更清晰、信息引用也更明確的回復(fù),免費(fèi)模式也讓必應(yīng)搜索用戶規(guī)模猛增,令Google感受到壓力。
微軟卻在New Bing上線數(shù)天內(nèi)做了數(shù)次修改,極大限制了用戶詢問的范圍和對(duì)話次數(shù)——不少用戶發(fā)現(xiàn),該產(chǎn)品會(huì)在對(duì)話中表現(xiàn)出更多的“情感”甚至是攻擊性,這對(duì)于數(shù)年前就因AI對(duì)話失控而緊急下線產(chǎn)品的微軟是不可接受的,因而選擇減少推理次數(shù)防止AI“暴走”。
圖源:必應(yīng)
取代Midjourney成為AI繪畫代名詞的Stable Diffusion,同樣在2023年2月迎來了一輪“暴走”,不過是開發(fā)者熱情和社群討論熱度上的。過去數(shù)個(gè)月間,各路開發(fā)者在開源基礎(chǔ)上添磚加瓦研發(fā)各類插件,其中幫助用戶快速制作能定向生成畫面的Lora模型相當(dāng)火熱。
Lora可以通過數(shù)十張圖像和較短的時(shí)間,就訓(xùn)練出畫面風(fēng)格和具體細(xì)節(jié)相當(dāng)收斂的內(nèi)容,例如特定藝術(shù)家的畫風(fēng)、攝影師的拍攝風(fēng)格、人物的相貌和搭配特色。Lora同時(shí)還推動(dòng)了真實(shí)化圖像生成的又一次爆發(fā),將ACG角色和真人結(jié)合的“賽博Coser”,在全球范圍引發(fā)話題。
(圖源:Stable Diffusion)
如何控制畫面元素來收斂到想要的圖像,是Stable Diffusion從誕生之日起就最為用戶關(guān)注的事情。最初主要通過提示詞(prompt)組合,來獲得盡可能接近描述的畫面內(nèi)容,但背后是大量用戶不斷嘗試摸索并不能快速獲得結(jié)果,和Lora一樣生成定向內(nèi)容的ControlNet出現(xiàn)。
ControlNet可快速分析參考圖的深度、輪廓、人物姿勢(shì)等信息,并輸出與提取出的信息一致的畫面。如此一來,無需設(shè)計(jì)嘗試復(fù)雜的提示詞,就能生成符合要求的動(dòng)作或畫面元素。先使用各類3D軟件生成動(dòng)作畫面,然后再輸入到AI生成畫面,整體生成效率得到顯著提升。
AI解放更多勞動(dòng)力?
人們看待AIGC的態(tài)度,以及如何使用AIGC的方式,正在和這項(xiàng)技術(shù)一同快速轉(zhuǎn)變。
博士二年級(jí)的小鄭原本需要花費(fèi)不少時(shí)間解讀學(xué)術(shù)論文,最近她發(fā)現(xiàn)New Bing也是個(gè)協(xié)助看論文的好工具。微軟將該AI植入Edge瀏覽器以提升用戶量,而與瀏覽器本身的PDF閱讀器功能組合,能讓New Bing直接解讀論文并提取關(guān)鍵信息,翻譯效率也比純?nèi)斯じ叱霾簧佟?/p>
除了讓AI幫忙快速“刷論文”,小鄭還在用New Bing和ChatGPT對(duì)話來給論文提供思路。她覺得AI在籌備論文過程中的偏重復(fù)勞動(dòng)部分能有效減輕工作量,生成的提綱和思路在不少時(shí)候的確能有作用,雖然在發(fā)散性思維及創(chuàng)新上依然有限,卻切切實(shí)實(shí)地減少了熬夜的必要。
(圖片來自:雷科技)
使用AI來完成論文的這段時(shí)間,小鄭也覺得很掙扎。AI遠(yuǎn)超人類的邏輯理解效率,令她開始懷疑自己參與科研的身份和價(jià)值,懷疑自己是否真的有進(jìn)行下去的能力。導(dǎo)師和學(xué)校對(duì)于AI的態(tài)度也讓她和同學(xué)保持擔(dān)憂,若習(xí)慣讓AI代勞后又一夜之間回到純手工勞動(dòng),會(huì)有不小打擊。
AI繪畫模型生成過程中的版權(quán)等倫理問題,在多國(guó)美術(shù)工作者群體間引發(fā)了激烈爭(zhēng)吵,近期還有主打美術(shù)表現(xiàn)的游戲,因未經(jīng)告知就使用AI參與創(chuàng)作的素材向用戶道歉。不過在游戲、影視、廣告等行業(yè)中,越來越多的從業(yè)者開始利用AI進(jìn)行創(chuàng)意指導(dǎo),提升工作溝通效率。
大周在游戲制作組中承擔(dān)故事撰寫和美術(shù)溝通工作,他需要跟美術(shù)同事反復(fù)溝通,來確保最終出現(xiàn)在游戲中的角色、道具、場(chǎng)景、UI乃至整個(gè)畫面,都是符合預(yù)期和項(xiàng)目要求的。最初他需要做出相對(duì)復(fù)雜的文字描述,還要找外部素材做參考圖,但始終少不了反復(fù)修改打磨。
(圖源:英偉達(dá))
利用AI預(yù)先生成圖像來做參考,比起純文字和其他素材來得更準(zhǔn)確,溝通過程變得更加直觀高效。大周覺得對(duì)美術(shù)的理解幫助他更有效生成參考圖,不過他有了新的煩惱,需要去安撫美術(shù)同事面對(duì)AI進(jìn)入工作流程的不滿,試圖讓對(duì)方也認(rèn)為這項(xiàng)技術(shù)的正面收益處于大多數(shù)。
跟蹤報(bào)道互聯(lián)網(wǎng)多年的寧寧最近得到復(fù)數(shù)信源爆料,多家國(guó)內(nèi)互聯(lián)網(wǎng)公司正摩拳擦掌打造大語言模型。這場(chǎng)軍備競(jìng)賽會(huì)擴(kuò)大到幾乎所有能想到的大公司,而不僅限于在AI深度耕耘多年且有貼吧、知道、百科等豐富語料來源的百度,AIGC正成為互聯(lián)網(wǎng)所追逐的下一個(gè)風(fēng)口。
和許多科技記者當(dāng)下觀點(diǎn)類似,寧寧并不看好國(guó)內(nèi)互聯(lián)網(wǎng)公司一比一打造自己的ChatGPT。OpenAI在ChatGPT獲得現(xiàn)象級(jí)熱度之前,早就燒掉了一般科技公司無法接受的預(yù)算,研發(fā)周期更是長(zhǎng)到大多數(shù)人難以想象。她認(rèn)為,互聯(lián)網(wǎng)公司做大語言模型很可能因缺少目標(biāo)而放棄。
圖源:ATRIA
寧寧也表示,以具體的業(yè)務(wù)需求做導(dǎo)向,會(huì)是國(guó)內(nèi)互聯(lián)網(wǎng)大規(guī)模應(yīng)用AIGC的實(shí)際方向。實(shí)際上,已經(jīng)能夠在不少圖文、視頻內(nèi)容平臺(tái)提供的創(chuàng)作工具中見到AI技術(shù)蹤影,AIGC應(yīng)用范圍進(jìn)一步擴(kuò)大更降低普通用戶創(chuàng)作門檻,個(gè)人用手機(jī)制作內(nèi)容的精致程度有望得到普遍提升。
用好AI,路還很長(zhǎng)
New Bing將為微軟帶去怎樣的具體商業(yè)回報(bào),現(xiàn)在還沒有定數(shù),不過網(wǎng)易似乎有望成為最早將大語言模型提供的對(duì)話體驗(yàn)轉(zhuǎn)化為業(yè)績(jī)的公司之一。預(yù)計(jì)2023年上線的網(wǎng)易旗下《逆水寒》手游,近期公布了“智能NPC”系統(tǒng),能不受預(yù)設(shè)文本限制和NPC對(duì)話,提升“大世界”沉浸感。
根據(jù)目前公開的演示內(nèi)容,玩家可用語音發(fā)言表達(dá),無論是如何天馬行空的想法,游戲NPC都能理解并做出相應(yīng)行動(dòng),于是每個(gè)人的游戲體驗(yàn)都會(huì)不盡相同。在傳統(tǒng)游戲設(shè)計(jì)中,故事對(duì)話都基于預(yù)設(shè)文本展開,最多有數(shù)個(gè)選項(xiàng)可供選擇,而如此自由的交流無疑會(huì)大幅拓展可玩性。
(圖片來自逆水寒)
像是把《西部世界》電視劇帶到游戲中的該技術(shù),源自網(wǎng)易伏羲進(jìn)行的長(zhǎng)期AI研究,與游戲結(jié)合實(shí)現(xiàn)有高自由度、可自生成體驗(yàn),也讓我們看到了AIGC落地產(chǎn)生更多商業(yè)價(jià)值的曙光。網(wǎng)易還表示已經(jīng)將可對(duì)話的NPC,按設(shè)定約束成“大宋江湖的人”,不會(huì)有超出游戲范圍的回應(yīng)。
錢之外,如何解決好潛在的倫理道德問題,也是AIGC目前的一大難點(diǎn)。早在數(shù)個(gè)月前,關(guān)于專門針對(duì)特定對(duì)象學(xué)習(xí)輸出畫面的討論,就曾讓AI繪畫陷入不小的風(fēng)波。很顯然,Lora在Stable Diffusion基礎(chǔ)上變得更有針對(duì)性,社群中就涌現(xiàn)了多個(gè)基于真實(shí)人物的模型。
更易于獲得的真實(shí)人物圖像,必然伴隨著人物肖像權(quán)爭(zhēng)議,乃至可能會(huì)增加的詐騙案件數(shù)量。怎樣管理好涉及到真實(shí)人物的AIGC內(nèi)容,避免潛在風(fēng)險(xiǎn)并在更強(qiáng)大的AI技術(shù)出現(xiàn)前防范于未然,顯然會(huì)是接下來會(huì)受到?jīng)_擊的各方將要加大投入的部分。
在科幻作品中,AI常常被視作導(dǎo)致人類危機(jī)的關(guān)鍵因素,好在現(xiàn)實(shí)中的AI技術(shù)不過是另一種提升效率的工具。隨著更多的人了解AI不再霧里看花,開始有越來越多的聲音在正視其工具屬性,當(dāng)然想要AI最大效率發(fā)揮作用,還有技術(shù)進(jìn)步之外的大量工作要做。
網(wǎng)站首頁 |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com