前段時(shí)間,人類藝術(shù)家們在 Instagram 上發(fā)起 #artbyhumans運(yùn)動(dòng),抵制 AI 作畫,“影響藝術(shù)家收入”、“AI 在藝術(shù)作品里抓取再拼貼”……不知當(dāng)他們看完 AI 畫出來的手后,會(huì)不會(huì)稍微松口氣?
【資料圖】
AI 畫“手”|Medium
因?yàn)橄胂罅蛣?chuàng)造力,AI 被吹捧上天,但不可忽視的是,它們畫出來的手如此笨拙、怪異,像驚悚電影里的道具。
網(wǎng)上流傳著這樣的梗圖,調(diào)侃 AI 的繪畫功底。
“怎么辨別這是 AI 畫的?看手就行了?!保黅witter
那么,為什么 AI 畫不好手?
有一說一,手是真的很難畫?。?/p>
別說 AI,人類自己都不一定能把手畫明白。
荷蘭藝術(shù)家埃舍爾(M.C. Escher)在 1948 年創(chuàng)作過一幅石版畫,名字就叫 Drawing Hands(畫手)。畫面中,兩只手通過畫筆彼此相連,“一只手創(chuàng)造了另一只,而另一只又創(chuàng)造了第一只”,這種矛盾恰恰表達(dá)出了:人們想要描繪出兩只動(dòng)態(tài)的手有多難。
Drawing Hands|Wikipedia
如果再搜一搜,你會(huì)發(fā)現(xiàn)“畫不好手”是一個(gè)困擾全球畫師的難題。插畫家 Anna Daviscourt 寫道:“畫手是最有表現(xiàn)力,最復(fù)雜,解剖學(xué)程度精細(xì)的工程?!?/p>
還有人把問題拋給了 AI 的“自家人”——ChatGPT。
ChatGPT 答道:“手是由許多小骨頭、肌肉和肌腱組成的,所有這些都必須被準(zhǔn)確描繪出來才行。此外,手的位置也很難表達(dá),因?yàn)樗鼈儾粩嘣谶\(yùn)動(dòng)狀態(tài)中。因?yàn)檫@些困難,許多藝術(shù)家發(fā)現(xiàn),手部繪畫是他們技藝中最令人沮喪和最具挑戰(zhàn)性的方面之一?!?/p>
ChatGPT 的解答
手的復(fù)雜性不僅僅在于它本身就有很多個(gè)關(guān)節(jié)、折痕等微小卻關(guān)鍵的細(xì)節(jié),還在于手每動(dòng)一下,原有的關(guān)節(jié)都會(huì)變得不同。
有人還真數(shù)過,從手指的長寬度,到掌骨與腕關(guān)節(jié),一只手大概就有 30 個(gè)幾何變化點(diǎn),這還不包括手掌的陰影與褶皺的變化。
圖源:GIPHY
如果你仔細(xì)觀察的話,會(huì)發(fā)現(xiàn)大多數(shù)卡通人物的手都只有 4 個(gè)指頭(三個(gè)手指和一個(gè)大拇指),因?yàn)樵趧?dòng)畫流程制作繁復(fù)的早期,少畫一根手指省時(shí)省力,還省錢!迪士尼曾透露過,少畫 1 根手指為公司節(jié)省過上百萬美金。
比起面部,手并沒有那么多可供 AI 學(xué)習(xí)的樣本
AI 在“創(chuàng)造”藝術(shù)時(shí)并沒有邏輯思維,它并不知道這里或者那里“應(yīng)該”有什么,只能先接收人類的指令,再與系統(tǒng)內(nèi)的訓(xùn)練庫進(jìn)行比照,用生成的圖像盡可能回答“what is this”(這是什么),而非“why is this”(為什么是這個(gè))。
所以,你要想生成更加精準(zhǔn)的圖像,比如一頭栩栩如生的小豬,就要給 AI 足夠具體的指令。
指定提示詞前后,AI 畫出的小豬對比|itpedia
但這還遠(yuǎn)遠(yuǎn)不夠,人們要想 AI 畫得精準(zhǔn),還要提供足夠豐富的真實(shí)圖像標(biāo)注,讓 AI 學(xué)習(xí)。
手這個(gè)復(fù)雜幾何形狀,意味著沒有通用的線條或形狀集合,可供 AI 識別手。所以,AI 必須結(jié)合許多不同的形狀、組合來畫出令人信服的手。
而為什么 AI 總是把手畫殘,恰恰是因?yàn)闆]有充足的參照物。
知乎上有網(wǎng)友這樣解答:“一張圖片上,手往往占的面積很小,經(jīng)常被遮擋和半遮擋,導(dǎo)致手部所占像素較少細(xì)節(jié)不夠。而且,手部的標(biāo)注是要準(zhǔn)確標(biāo)注手掌、拇指、食指、中指、無名指和小拇指才可以,這部分的工作算法很難自動(dòng)化,需要人類來完成,這就大大增加了成本?!?/p>
一只手,應(yīng)該被正確標(biāo)注出的部分(右上)|知乎
這可不是極個(gè)別情況,如果把人類的臉變成像手一樣復(fù)雜的動(dòng)態(tài)結(jié)構(gòu),AI 也同樣畫不明白。
在我們的臉上,唯一能活動(dòng)的關(guān)節(jié)是顳頜關(guān)節(jié),在一些二次元作品中,還常常弱化這個(gè)關(guān)節(jié)的存在。但如果我們的面部變得足夠“靈活”,比如,鼻子可伸縮,舌頭能打結(jié),那 AI 肯定也會(huì)犯難。
還有一個(gè)讓“AI 畫不好手”傳播開來的原因,那就是:手一旦畫錯(cuò),真的是很明顯啊!
如果 AI 創(chuàng)造了一個(gè)比例不太對的肩膀,我們一般不會(huì)注意到畫面中這個(gè)人的肩膀窄了百分之五。但如果他們的拇指、食指、中指、無名指和小指都比平均水平小一點(diǎn),那就容易顯得奇怪了。
這是受到人的固有感知影響。心理學(xué)有一個(gè)理論叫做“撒切爾效應(yīng)”,1980 年由約克大學(xué)心理學(xué)教授彼得·湯普提出,當(dāng)時(shí)他以撒切爾夫人的畫像作例。
撒切爾效應(yīng)|Wikipedia
我們第一眼能看出什么?右圖的眼睛與嘴巴被上下顛倒了。你需要更仔細(xì)才能看出,左圖的五官實(shí)際上也是錯(cuò)位的。
也就是說,錯(cuò)位發(fā)生在正立的臉上很容易露餡,但發(fā)生在倒立的臉上就能騙過人。因?yàn)槲覀兤饺绽锖茈y見到倒立的臉,難以形成固有認(rèn)知,所以在你把屏幕旋轉(zhuǎn)過來之前,很難看出不同。
而我們對手部太熟悉了,感知格外敏感。
AI 創(chuàng)作的“手”|Gagadget
教會(huì) AI 畫手,有啥方法嗎?
不得不說,人類在提升 AI 畫技方面,也是“卷”得孜孜不倦。
今年初,一個(gè)叫“ControlNet”的新 AI 插件在 GitHub 上爆火,如今已收獲超過 10k 星。
簡單來說,這個(gè)插件通過給 Stable Diffusion 這樣的 AI 作畫模型增加一個(gè)額外輸入,來優(yōu)化生成的細(xì)節(jié),相當(dāng)于給 AI 創(chuàng)作加了一層 buff。
效果的確比之前過于抽象的手部創(chuàng)作靠譜了些,但如果仔細(xì)看的話,你還是會(huì)發(fā)現(xiàn)……咦,怎么一共有 6 個(gè)手指?
點(diǎn)開放大,數(shù)數(shù)一共幾個(gè)手指|Github
也有一些比較取巧的方法。比如,有人傳授經(jīng)驗(yàn):要想讓 AI 畫出一只正常的手,你只需要告訴它“mittens”(手套)這一個(gè)詞,往往在有手套的圖片中,五個(gè)手指根根分明,且沒有什么特殊的手勢。
一雙手套|Gagadget
或者告訴它“結(jié)婚戒指”、“指甲油”這兩個(gè)詞。AI 往往就能搜索到很多高清的手部照片,降低畫殘概率。
戒指或指甲油|Gagadget
說到底,這些都屬于一些幫助 AI 偷懶的小技巧,要論畫手的真實(shí)力,AI 還是咱們?nèi)祟悾嫉煤煤脤W(xué)習(xí)??!
關(guān)鍵詞:
網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com