AI 的「iPhone 時刻」已經(jīng)到來
在剛結(jié)束的英偉達 GTC 2023 大會上,英偉達 CEO 黃仁勛把這個觀點反復說了 3 遍。
怎么理解?
(資料圖片)
iPhone 搭載的多點觸摸屏幕技術開創(chuàng)了一個全新的智能手機界面交互模式,由此孕育了移動互聯(lián)網(wǎng)。
而 ChatGPT、Stable Diffusion 等 AI 超級應用的出現(xiàn),標志著加速計算和 AI 技術的成熟已邁入成熟,AI 正以一個前所未有的速度滲入各行各業(yè),推動一場新的產(chǎn)業(yè)革命。
經(jīng)過近幾年 AI 技術的不斷發(fā)展,強大算力和先進模型為 AI 提供了合適的應用平臺,促使各個廠商們重新構(gòu)想自己的產(chǎn)品和商業(yè)模型,以及更新迭代的速度。
昨天晚上,英偉達、微軟、Google、Adobe 等廠商在相差無幾的時間里都推出了各自的 AI 服務,你追我趕之勢仿佛在傳達著同一個焦慮:
「在這個大 AI 時代,如果不想被人顛覆,就要先顛覆別人。」
AI 將會怎樣改變我們的生活?看過這「AIGC 最卷一夜」后,你或許能有更深的感觸。
英偉達正在把 AI 帶到各行各業(yè)
英偉達在一年一度的 GTC 大會上又帶來了很多讓人眼前一亮的「新活」。
例如發(fā)布了一項名為 CuLitho 的 AI 輔助制芯技術,為 2nm 制程鋪平了道路;與路特斯、奔馳、寶馬等汽車廠商合作,用 Omniverse 搭建數(shù)字生產(chǎn)線等。
但要說到整場 GTC 大會最亮眼的內(nèi)容,還得是英偉達發(fā)布的新顯卡——帶有雙 GPU NVLink 的 H100 NVL。
H100 NVL 是專門針對算力需求巨大的 ChatGPT 而設計的顯卡,H100 NVL 擁有夸張的 188GB HBM3 內(nèi)存(每張卡 94GB),這也是目前英偉達發(fā)布的內(nèi)存最大的顯卡。
像 GPT 這樣的大語言模型非常占用內(nèi)存資源,理論上參數(shù)達到上千億的 GPT 模型可以迅速占滿一張 H100 顯卡。
與用于 GPT-3 處理的 HGX A100 相比,使用了四對 H100 和雙 GPU NVLink 的標準服務器的速度快了 10 倍,「核彈級」的 H100 NVL 是大規(guī)模部署像 ChatGPT 語言模型的理想選擇。
英偉達整的另一個大活就是把「ChatGPT 同款」搬到了云上,向公眾開放。
ChatGPT 的運行主要依靠由 A100 或 H100 組成的 DGX 超級計算機,微軟為此花了數(shù)億美金采購了上萬張 A100 顯卡組建 Azure 云計算平臺。
為了降低用戶部署大模型的成本,英偉達推出了 DXG Cloud 服務,每個月 36999 美元起,你就能獲得一個由 8 張 H100 或 A100 顯卡組成的云端超級計算機,輕松完成高負載的計算工作。
2016 年,老黃親手向 OpenAI 交付了第一臺 DGX 超級計算機電腦。7 年之后,頂尖的 AI 算力通過 DXG Cloud 有機會走進每家公司,完成在過去不可能完成的任務。
不難想象,像 ChatGPT 這樣能夠改善人類交流、提高工作效率的先進應用會持續(xù)涌現(xiàn),為我們的生活帶來更多的便利和驚喜。
點石成金,二代 Runway 讓你一句話生成各式大片
B 站一直流行一句梗:視頻不能 P,所以這是真的。但如今視頻不僅可以 P,還可以從無到有直接用 AI 生成,不用畫師、不用攝影、不用后期。只要你往 Runway 中輸入一段文字,它便還你一段震撼人心的短片。
最早,Runway 是一款后期輔助工具,雖然借助了人工智能的神奇力量,但所能實現(xiàn)的,并不復雜:擦除物體、圖像插幀、刪除背景、運動追蹤等,可以將它視作 Adobe Premiere 的傻瓜式插件。
而當 Runway 打開人工智能的新大門后,它擁有了點石成金的能力。在去年 9 月公布的 Gen 1 版本中,它有了文本轉(zhuǎn)視頻的能力。那時的人們,剛剛見識過文本轉(zhuǎn)圖像的魔力,而 Runway 直接能生成動態(tài)影像,簡直是降維打擊般的震撼。
時隔半年,Runway Gen 2 來了。
比起 Gen 1 模型,它實現(xiàn)了更高的時間一致性和保真度,說人話就是畫面之間的聯(lián)接得更順暢了,畫質(zhì)還更高清了。
用上 Gen 2,距離隨時隨地生成自己想象的視頻更近了。
輸入一條不算長的提示詞:無人機航拍的山脈。據(jù)此 Runway 生成出以下畫面。
再來一個:午后陽光照進紐約市中一幢公寓的窗戶。
來個進階版,給 Runway 喂進圖片和文字,進而生成一段短片。
▲ 文字為:一個男人走在街上,周圍酒吧的霓虹燈照亮了他
▲ 原圖
或者是讓一幅靜態(tài)圖片動起來。
還可以將一張無紋理待渲染動圖,直接渲染出動態(tài)影像。
Runway 的進步有目共睹,在對抗網(wǎng)絡模型路上越走越遠、越走越順,如今的 Gen 2 版本已經(jīng)算是「可看」的程度,雖稱不上精致,但未來可期。
或許到了 Gen 3 版本,我們就能在它的幫助下,一鍵生成抖音爆款短片。到時候,這會是優(yōu)質(zhì)博主的噩夢嗎?
突發(fā)!Google 開啟 Bard 測試
如果說英偉達讓我們看到了 AI 發(fā)展的未來,那 Google 的 Bard 就是 AI 的今天。
在大家被 GPT-4 和 Midjourney V5 震撼刷屏一周后、老黃展望未來 AI 時代的同時,Google 宣布正式開放 Bard 的訪問:請嘗試 Bard,并提供你的反饋。
根據(jù) Google 的最新演示,相比 ChatGPT,Bard 更像是一個專注于工作學習的隨身助理,你可以在它的協(xié)助下,激發(fā)想法、滿足好奇心。
你可以讓 Bard 用簡單的語言解釋量子物理學,或者讓它提供頭腦風暴,幫你在一年內(nèi)閱讀 20 本書。
Google 表示,用戶可以在 Bard 的協(xié)助下,加速想法、激發(fā)好奇心。你可以使用 Bard 提供一些技巧,比如如何實現(xiàn)一年閱讀 20 本書,或者用簡單的語言解釋量子物理學。
在演示中內(nèi)容中我們還發(fā)現(xiàn)了一些細節(jié),Bard 似乎會同時生成多個回答,你可以根據(jù)需求選擇最適合你的那一個,并進行持續(xù)提問。
當然,ChatGPT 也可以生成多個回答,但它是在回答結(jié)束后重新生成,相較來看,Bard 更像是一個會同時提供多種方案的乙方。
可能是 ChatGPT 和 Bing Chat 的負面消息引起了 Google 的重視,后者不斷強調(diào) Bard 只是一場實驗,Bard 生成的信息并不代表 Google 的觀點。
Google 表示,雖然 Bard 由大型語言模型提供支持,并會隨著時間推移而日漸強大,但它會學習到一些偏見或者刻板印象,導致它「自信滿滿」地說出一些不準確或者虛假的信息,比如它會將「ZZ Plant」理解為 Zamioculcas zamioculcas,而不是正確的 Zamioculcas zamiifolia。
有了 Bing Chat「瘋了」的前車之鑒,Bard 的第一個測試版就限制了同一對話中的交流次數(shù),從而保證內(nèi)容的準確。當你第一次登陸 Bard 時,它就會告訴你這只是一個實驗,并期待你的反饋。
作為 Bard 的第一個版本,它暫時還不支持更多語言(包括中文),Google 會持續(xù)更新寫代碼、識別/生成圖片以及多語言支持。
▲ Bard:我不會中文,但希望未來會說
目前,Bard 僅在英國、美國開放訪問權(quán)限,未來會逐漸擴展到更多國家和地區(qū)。
聊天就能做圖,Bing Chat 更進一步
Bing Chat 到底有多火,或許只有上線一個月就讓 Bing 日活首次突破 1 億的數(shù)據(jù)能說明了。從復雜問題到娛樂聊天,再到靈感創(chuàng)意的實現(xiàn),Bing Chat 正在重塑我們網(wǎng)絡搜索的體驗。
現(xiàn)在起,你可以讓 Bing Chat 畫圖了。
微軟為新 Bing 和 Edge 瀏覽器的預覽版更新了三個新功能:Bing Image Creator、人工智能驅(qū)動的 Stories 以及 Knowledge Cards 2.0。其中最重要的當屬可以畫畫的 Bing Image Creator。
微軟表示,人腦處理視覺信息的速度比文本快約 6 萬倍,Bing 的搜索數(shù)據(jù)中,圖像是搜索最多的類型之一,而由 DALL·E 模型的高級版本提供支持的 Bing Image Creator,可以讓我們通用自己的語言在 Bing Chat 中描述圖片信息、選擇藝術風格,Image Creator 就會聯(lián)系上下文,將你的想象「畫在紙上」。
Bing Image Creator 的加入,讓 Edge 瀏覽器變成了第一個集成人工智能圖像生成器的瀏覽器。
由人工智能驅(qū)動的 Stories 和 Knowledge Cards 2.0,可以讓你在搜索后獲得圖像、短視頻以及由人工智能驅(qū)動的信息圖表,可以一目了然的獲取事實和關鍵信息。
未來使用 Bing 搜索時,你獲得的就不是一個個冷冰冰的網(wǎng)頁鏈接,而是更加豐富、有趣的圖片、視頻以及視覺故事。
如果你已經(jīng)通過新 Bing 申請,現(xiàn)在就可以在 Bing Chat 中體驗 Bing Image Creator 了,如果從以下網(wǎng)址進去的話,則可以直接試用。
https://www.bing.com/create
不過這一功能暫只支持英文,未來會持續(xù)更新。
Adobe Firefly:「友軍中的最強輔助」
當科技公司卷到圖片生成后,著名設計創(chuàng)意公司 Adobe 自然不甘人后。在這個瘋狂的夜晚,Adobe 也推出了自己的創(chuàng)意生成式 AI 模型集:Adobe Firefly。
Adobe 用幾個簡單的例子展示了 Firefly 的能力。你可以用一句話,讓正處于春天的風景,變成冬天的模樣。
你也可以在草地上用筆刷隨意刷一下,然后告訴 Firefly 這是一條河,它就會自動生成河流。
Firefly 能做的自然不只這些,框選狗狗的毛發(fā),它可以將毛發(fā)變成畫筆,現(xiàn)場幫狗狗改變發(fā)型;設計一個藝術字,它能幫你生成一個單詞、一句話;設計好一款耳機,F(xiàn)irefly 還能把它放到場景中,變成產(chǎn)品展示圖……
Adobe 認為,AI 正在提供一種打開世界的新方式,設計師可以用最順手的方式來實現(xiàn)創(chuàng)意,「幫助創(chuàng)意人而不是取代創(chuàng)意人」。
同時,Adobe 還創(chuàng)立了「內(nèi)容真實性倡議」CAI,建立了可信數(shù)字內(nèi)容歸屬的全球標準,并對人工智能生成的內(nèi)容進行標記,打造 Firefly 生態(tài)系統(tǒng),「Adobe Firefly 是友軍,更是友軍里的最強輔助」。
進擊的 AIGC
這一夜里,我們見證了 AI 領域從服務層到應用層的幾個大突破。
這些扎堆出現(xiàn)的更新從側(cè)面證明了,AI 領域邁進了一個高速發(fā)展的階段。上一個月 AI 可能還畫不好手指,下一個月憑借算力提升和模型升級,AI 已經(jīng)能取代掉服裝模特的工作。
無數(shù)的科幻作品都預言過 AI 在未來會成為我們生活的一部份,但沒有人告訴過我們,我們離這個未來只有咫尺之遙。
我們的生活正在被 AI 一點點地改寫。在 GTC 大會上,黃仁勛提出了一個很有意思觀點,他認為生成式 AI 就是一種新型的計算機,我們可以用人類語言進行編程,任何人都可以命令計算機來解決問題。
過去的幾個月里,我們見證了 AI 是如何逐步掌握畫畫、寫作、剪輯、制表、做 PPT 等技能,按照這個進化速度發(fā)展下去,還有什么是 AI 不能做的嗎?
OpenAI 的 CEO Sam Altman 最近在 Twitter 上大膽預測了新版「摩爾定律」,他認為全球人工智能運算量每隔 18 個月就會翻一番。
也就是說,如果你對生成式 AI 還留有質(zhì)疑,那么時間會給你最有力的答案。
關鍵詞:
網(wǎng)站首頁 |網(wǎng)站簡介 | 關于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com