網(wǎng)絡(luò)消費(fèi)網(wǎng) >  科技 > > 正文
別管它們叫“AI 畫手”了 AI連手都畫不好
時(shí)間:2023-03-14 22:25:07

前段時(shí)間,人類藝術(shù)家們在 Instagram 上發(fā)起 #artbyhumans運(yùn)動(dòng),抵制 AI 作畫,“影響藝術(shù)家收入”、“AI 在藝術(shù)作品里抓取再拼貼”……不知當(dāng)他們看完 AI 畫出來的手后,會(huì)不會(huì)稍微松口氣?


【資料圖】

AI 畫“手”|Medium

因?yàn)橄胂罅蛣?chuàng)造力,AI 被吹捧上天,但不可忽視的是,它們畫出來的手如此笨拙、怪異,像驚悚電影里的道具。

網(wǎng)上流傳著這樣的梗圖,調(diào)侃 AI 的繪畫功底。

“怎么辨別這是 AI 畫的?看手就行了?!保黅witter

那么,為什么 AI 畫不好手?

有一說一,手是真的很難畫?。?/p>

別說 AI,人類自己都不一定能把手畫明白。

荷蘭藝術(shù)家埃舍爾(M.C. Escher)在 1948 年創(chuàng)作過一幅石版畫,名字就叫 Drawing Hands(畫手)。畫面中,兩只手通過畫筆彼此相連,“一只手創(chuàng)造了另一只,而另一只又創(chuàng)造了第一只”,這種矛盾恰恰表達(dá)出了:人們想要描繪出兩只動(dòng)態(tài)的手有多難。

Drawing Hands|Wikipedia

如果再搜一搜,你會(huì)發(fā)現(xiàn)“畫不好手”是一個(gè)困擾全球畫師的難題。插畫家 Anna Daviscourt 寫道:“畫手是最有表現(xiàn)力,最復(fù)雜,解剖學(xué)程度精細(xì)的工程?!?/p>

還有人把問題拋給了 AI 的“自家人”——ChatGPT。

ChatGPT 答道:“手是由許多小骨頭、肌肉和肌腱組成的,所有這些都必須被準(zhǔn)確描繪出來才行。此外,手的位置也很難表達(dá),因?yàn)樗鼈儾粩嘣谶\(yùn)動(dòng)狀態(tài)中。因?yàn)檫@些困難,許多藝術(shù)家發(fā)現(xiàn),手部繪畫是他們技藝中最令人沮喪和最具挑戰(zhàn)性的方面之一?!?/p>

ChatGPT 的解答

手的復(fù)雜性不僅僅在于它本身就有很多個(gè)關(guān)節(jié)、折痕等微小卻關(guān)鍵的細(xì)節(jié),還在于手每動(dòng)一下,原有的關(guān)節(jié)都會(huì)變得不同。

有人還真數(shù)過,從手指的長寬度,到掌骨與腕關(guān)節(jié),一只手大概就有 30 個(gè)幾何變化點(diǎn),這還不包括手掌的陰影與褶皺的變化。

圖源:GIPHY

如果你仔細(xì)觀察的話,會(huì)發(fā)現(xiàn)大多數(shù)卡通人物的手都只有 4 個(gè)指頭(三個(gè)手指和一個(gè)大拇指),因?yàn)樵趧?dòng)畫流程制作繁復(fù)的早期,少畫一根手指省時(shí)省力,還省錢!迪士尼曾透露過,少畫 1 根手指為公司節(jié)省過上百萬美金。

比起面部,手并沒有那么多可供 AI 學(xué)習(xí)的樣本

AI 在“創(chuàng)造”藝術(shù)時(shí)并沒有邏輯思維,它并不知道這里或者那里“應(yīng)該”有什么,只能先接收人類的指令,再與系統(tǒng)內(nèi)的訓(xùn)練庫進(jìn)行比照,用生成的圖像盡可能回答“what is this”(這是什么),而非“why is this”(為什么是這個(gè))。

所以,你要想生成更加精準(zhǔn)的圖像,比如一頭栩栩如生的小豬,就要給 AI 足夠具體的指令。

指定提示詞前后,AI 畫出的小豬對比|itpedia

但這還遠(yuǎn)遠(yuǎn)不夠,人們要想 AI 畫得精準(zhǔn),還要提供足夠豐富的真實(shí)圖像標(biāo)注,讓 AI 學(xué)習(xí)。

手這個(gè)復(fù)雜幾何形狀,意味著沒有通用的線條或形狀集合,可供 AI 識別手。所以,AI 必須結(jié)合許多不同的形狀、組合來畫出令人信服的手。

為什么 AI 總是把手畫殘,恰恰是因?yàn)闆]有充足的參照物。

知乎上有網(wǎng)友這樣解答:“一張圖片上,手往往占的面積很小,經(jīng)常被遮擋和半遮擋,導(dǎo)致手部所占像素較少細(xì)節(jié)不夠。而且,手部的標(biāo)注是要準(zhǔn)確標(biāo)注手掌、拇指、食指、中指、無名指和小拇指才可以,這部分的工作算法很難自動(dòng)化,需要人類來完成,這就大大增加了成本?!?/p>

一只手,應(yīng)該被正確標(biāo)注出的部分(右上)|知乎

這可不是極個(gè)別情況,如果把人類的臉變成像手一樣復(fù)雜的動(dòng)態(tài)結(jié)構(gòu),AI 也同樣畫不明白。

在我們的臉上,唯一能活動(dòng)的關(guān)節(jié)是顳頜關(guān)節(jié),在一些二次元作品中,還常常弱化這個(gè)關(guān)節(jié)的存在。但如果我們的面部變得足夠“靈活”,比如,鼻子可伸縮,舌頭能打結(jié),那 AI 肯定也會(huì)犯難。

還有一個(gè)讓“AI 畫不好手”傳播開來的原因,那就是:手一旦畫錯(cuò),真的是很明顯啊!

如果 AI 創(chuàng)造了一個(gè)比例不太對的肩膀,我們一般不會(huì)注意到畫面中這個(gè)人的肩膀窄了百分之五。但如果他們的拇指、食指、中指、無名指和小指都比平均水平小一點(diǎn),那就容易顯得奇怪了。

這是受到人的固有感知影響。心理學(xué)有一個(gè)理論叫做“撒切爾效應(yīng)”,1980 年由約克大學(xué)心理學(xué)教授彼得·湯普提出,當(dāng)時(shí)他以撒切爾夫人的畫像作例。

撒切爾效應(yīng)|Wikipedia

我們第一眼能看出什么?右圖的眼睛與嘴巴被上下顛倒了。你需要更仔細(xì)才能看出,左圖的五官實(shí)際上也是錯(cuò)位的。

也就是說,錯(cuò)位發(fā)生在正立的臉上很容易露餡,但發(fā)生在倒立的臉上就能騙過人。因?yàn)槲覀兤饺绽锖茈y見到倒立的臉,難以形成固有認(rèn)知,所以在你把屏幕旋轉(zhuǎn)過來之前,很難看出不同。

而我們對手部太熟悉了,感知格外敏感。

AI 創(chuàng)作的“手”|Gagadget

教會(huì) AI 畫手,有啥方法嗎?

不得不說,人類在提升 AI 畫技方面,也是“卷”得孜孜不倦。

今年初,一個(gè)叫“ControlNet”的新 AI 插件在 GitHub 上爆火,如今已收獲超過 10k 星。

簡單來說,這個(gè)插件通過給 Stable Diffusion 這樣的 AI 作畫模型增加一個(gè)額外輸入,來優(yōu)化生成的細(xì)節(jié),相當(dāng)于給 AI 創(chuàng)作加了一層 buff。

效果的確比之前過于抽象的手部創(chuàng)作靠譜了些,但如果仔細(xì)看的話,你還是會(huì)發(fā)現(xiàn)……咦,怎么一共有 6 個(gè)手指?

點(diǎn)開放大,數(shù)數(shù)一共幾個(gè)手指|Github

也有一些比較取巧的方法。比如,有人傳授經(jīng)驗(yàn):要想讓 AI 畫出一只正常的手,你只需要告訴它“mittens”(手套)這一個(gè)詞,往往在有手套的圖片中,五個(gè)手指根根分明,且沒有什么特殊的手勢。

一雙手套|Gagadget

或者告訴它“結(jié)婚戒指”、“指甲油”這兩個(gè)詞。AI 往往就能搜索到很多高清的手部照片,降低畫殘概率。

戒指或指甲油|Gagadget

說到底,這些都屬于一些幫助 AI 偷懶的小技巧,要論畫手的真實(shí)力,AI 還是咱們?nèi)祟悾嫉煤煤脤W(xué)習(xí)??!

關(guān)鍵詞:

版權(quán)聲明:
    凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
    除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考并自行核實(shí)。
熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
 

Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
 

中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
 

聯(lián)系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業(yè)執(zhí)照公示信息