Text-to-Video文生視頻,繼作文、繪畫之后AI殺入的又一領域,有越來越多產(chǎn)品涌現(xiàn)。根據(jù)讀者爆料,一款主打AI生成視頻的產(chǎn)品,已經(jīng)在小圈子內(nèi)被頻頻提及,還是國產(chǎn)的。
(資料圖片僅供參考)
量子位迫不及待淺扒了一段關于曹操的介紹,喂給它,得到這樣一段視頻:
在不經(jīng)任何替換和干預的情況下,生成的視頻畫面符合人物、時代背景和部分文案提及的場景,效果還算不錯。
最最重要的是,用它制作一段視頻,幾乎不存在“剪輯”這個步驟,比以往圖文轉視頻的產(chǎn)品門檻更低,耗費的時間也更短。
但要評判這款產(chǎn)品到底是騾子是馬,還得多次體驗,再往深處挖一挖。
什么樣的產(chǎn)品?
這產(chǎn)品名叫一幀秒創(chuàng),本次體驗的主角是它最基礎常規(guī)的“文案一鍵生成視頻”。
開頭關于曹操的簡介視頻,是用該功能這樣生成的——
點擊該選項后,會跳出一個文本框供輸入標題和正文,底端可以選擇最終的畫面呈現(xiàn)形式是橫屏還是豎屏。
這一步驟實測下來,標題部分對后續(xù)內(nèi)容生成影響不大,現(xiàn)階段可以不用輸入,后續(xù)AI會自動提取補充。相對而言,第二個需要輸入文案內(nèi)容的部分非常重要。
量子位做了如圖文案輸入:
點擊右下角“下一步”,可以更改AI對文案進行的分類,也可以修改文案的分割。分割成n個小段的文案,承擔分鏡頭腳本文案的功能,以便后續(xù)AI從素材庫里匹配對應的視頻片段。
在這方面,AI的分割效果沒有出太大紕漏。
但從下圖可以看到,此處AI把曹操title中的“書法家”單獨作為一個分鏡頭文案,量子位對其進行了合并。
接下來就會進入最后的調(diào)試界面,分出兩大板塊,即左半部分的調(diào)整界面和右半部分的預覽界面。
通過左側的工具欄,在最頂端的場景部分,AI為文案匹配了12個視頻片段。
12個視頻片段中,原本AI為片段8生成的視頻中出現(xiàn)了現(xiàn)代社會的外國人。也就是說,在畫面內(nèi)容和文案內(nèi)容的匹配度上,AI能力還有所欠缺。
最終量子位通過小藍框中的替換素材功能,在素材庫中選擇了更符合文案的視頻畫面。
12個鏡頭整體拉片式通看一遍,直觀感受是視頻質(zhì)量算不上精致。雖然并非完全不相關,但還是與人類剪刀手的視頻編輯水平有明顯差距。
敲定視頻片段后,在音樂板塊挑選國風類型的BGM,又選擇了“磁性渾厚”的解說男聲,Logo和字幕都是默認選項。
一切確定,點擊生成視頻選項,就能在預覽板塊看到這一套搭配下來的視頻效果,最終生成文章開頭的視頻。
歷史分類的AI視頻效果不錯,那是否在每個分類下都有同等水平的效果呢?
又陸續(xù)還嘗試了科普類(量子位文章,扔進去)、美食類(宮保雞丁菜譜)等多種類別的文案,甚至還把谷歌Phenaki效果驚艷的小企鵝沖浪視頻的6句文案丟給了它。
結果顯示,科普類和美食類,生成視頻的表現(xiàn)都還算文案和畫面貼合。
但,小企鵝沖浪文案的生成效果就有些拉胯:
看遍視頻畫面的每一秒鐘,從未出現(xiàn)過一只企鵝,連影子都沒有……
Excuse me???
雖然部分畫面也和文案有所關聯(lián),比如出現(xiàn)人在沙灘上走的第一視角視頻片段。但和曹操視頻的效果相比,可以說大相徑庭,實在有點出乎意料。
無獨有偶,國外有個Quickvid同樣主打AI生成視頻的功能,同樣在小圈子里走紅。而目前開放Beta測試的Youtube Shorts功能,和上述國內(nèi)產(chǎn)品功能類似。
為了測試,把相同的小企鵝沖浪文案喂給了Quickvid。結果是,Quickvid生成的視頻里,仍然不見企鵝的蹤影,一幀也沒有!
(谷歌Phenaki聽后狂喜)
當然,Quickvid之所以走紅,并不是因為生成的視頻質(zhì)量驚人。除了成為文本生成視頻賽道的“早鳥”外,與背后的開發(fā)者密切相關。
開發(fā)者小哥名叫Daniel Habib,此前在Facebook的虛擬現(xiàn)實部門Oculus工作。
Quickvid走紅是從今年2月開始的,當時它正式從內(nèi)測轉為Beta測試,僅2月23日一天,就有2萬2千多人成為用戶。本月ChatGPT開放API后,Daniel把它接入了Quickvid,成為了第一批ChatGPT生態(tài)內(nèi)開發(fā)者。
量子位的視頻編輯對兩款產(chǎn)品也進行了試玩,用戶評價是這樣的:暫不認為這東西能威脅自己的就業(yè)。
但對于AI生成視頻展現(xiàn)出的趨勢,多少有點心有凄凄焉。
因為你不得不承認,用這玩意兒做視頻,完全不需要懂得剪輯知識。而且做一條同等質(zhì)量的視頻,相比人工剪輯,用AI生成,時間和資源投入顯著降低。
不完美的視頻創(chuàng)作AI工具
不僅僅是Quick接入了別人家的API,事實上,今天體驗的一幀秒創(chuàng)也接入了GPT-2的API,還用上了開源Stable Diffusion模型。
這不是猜測,是我們直接找到背后開發(fā)者“對質(zhì)”后得知的結果。
一幀秒創(chuàng)背后的公司叫做新壹科技。
這個名字或許比較陌生,但這個“新的一”是“一下科技”的“一”。
一下科技,曾經(jīng)多次站在視頻風口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,這是移動互聯(lián)網(wǎng)時代視頻領域響當當?shù)耐婕?。背后的團隊,也是源自搜狐視頻-酷6網(wǎng)-新浪視頻一脈的視頻內(nèi)容老兵們。
其創(chuàng)始人兼董事長韓坤,在創(chuàng)立一下科技之前,以聯(lián)合創(chuàng)始人的身份把酷6網(wǎng)打造成中國第一家在美國納斯達克上市的視頻網(wǎng)站。
新壹科技是韓坤手下孵化出的最新公司,現(xiàn)有團隊在2020年年中開始籌備,領隊人雷濤,現(xiàn)任新壹科技CEO,也是一下科技的創(chuàng)始團隊成員。
團隊正式組建的2020年12月,距ChatGPT出生還有一年,連DALLE-2和Stable Diffusion代表的AI繪畫也還沒有名聲大噪,但春江水暖鴨先知,一下內(nèi)部這支團隊感知到了AI對于視頻內(nèi)容創(chuàng)作的方向性改變。
因為視頻內(nèi)容的傳統(tǒng)和基因,新公司誕生之初,新壹并沒有把自己定位為一個人工智能公司。
他們希望從首先解決創(chuàng)作者需求切入,讓AI介入視頻生產(chǎn)全流程,盡可能降低視頻內(nèi)容創(chuàng)作門檻。
通過AI能力,讓用戶以低成本制作視頻,還能用秒拍平臺上的視頻為AI匹配提供一個龐大的素材庫,形成規(guī)模壁壘。
把秒拍作為現(xiàn)成的數(shù)據(jù)庫,這對新壹算是一個地利,不僅因為秒拍有10億級規(guī)模的視頻素材和數(shù)據(jù),更因為秒拍能為一幀秒創(chuàng)進行版權授予,讓AI生成的視頻有版權保障。
后者簡直解決了AIGC方面一直爭論不休的大問題。
所以首款產(chǎn)品一幀秒創(chuàng),有了明確的應用場景,也有了面向視頻內(nèi)容創(chuàng)作者、視頻自媒體營銷的方向。
這是一個集合多種AIGC能力的工具,但是,無論是文生圖還是AI幫寫,最終的目的都歸于一處——把它們作為素材應用到視頻生產(chǎn)流程,讓視頻生產(chǎn)更加高效。
為了高效和低門檻,一幀秒創(chuàng)盡量做到去剪輯化,創(chuàng)作視頻的過程從開放式變成了填空式。
雖然距離產(chǎn)出極致和精彩的視頻還有距離,但最直觀的是,哪怕完全不懂剪輯知識的人,也能上手制作視頻——甚至是批量制作。
社交平臺的剪輯小白用戶評價
目前,一幀秒創(chuàng)方面也知道,自己生成的視頻還不能和人工剪輯的視頻媲美,但是足以應對一些應用場景,如科普類視頻生成效果是最好的,批量生產(chǎn)內(nèi)容可以應用到抖音本地生活推廣。以及除了面向C端的高階功能訂閱模式,一幀秒創(chuàng)還有來自B端的商業(yè)合作,比如跟360搜索的合作,已經(jīng)獲得了不錯的反饋。
對于一幀秒創(chuàng)當前的初創(chuàng)狀態(tài),新壹也透露正在通過一些具體的解決方案改進。
比如創(chuàng)作者集中的內(nèi)容類別,投入更多的素材分析和標注成本;又比如推出私有化素材庫,提高匹配率和視頻片段替換率。
雷濤表明了一幀秒創(chuàng)的思路,稱作為產(chǎn)品公司,新壹科技雖然沒辦法讓技術和硬件等基礎條件實現(xiàn)跨越式的發(fā)展,然而,能夠在每一階段適時提供符合當時階段水平的應用,“這已經(jīng)足夠去忙了”。
他多次以智能手機時代開啟后,移動互聯(lián)網(wǎng)的產(chǎn)品開發(fā)機遇舉例,也多次用新能源、智能車變革進程中的理想造車模式類比,話里話外,追求的不是一步到位,而是與技術基礎設施和整個行業(yè)生態(tài)一起成長進步,而最關鍵的是,必須躬身入局,不能站著觀望。
這其中自然有視頻老兵對新周期的敏銳洞察,但也多少有些不甘心。
如果你對2015年以來的互聯(lián)網(wǎng)江湖還有記憶,應該多少能感知這種不甘心的合情合理。在如今字節(jié)獨大或抖音快手的雙雄格局之前,秒拍和一下科技,才是短視頻領域最火爆的明星公司。然而商場如戰(zhàn)場,如今的結局和市場份額,已經(jīng)再清楚不過了。
或許“贏回來”的最好方法就是贏在未來、贏在下一個時代。
而下一個時代就是AIGC。連比爾·蓋茨都說,背后不亞于互聯(lián)網(wǎng)的發(fā)明。
面向這個全新的創(chuàng)新創(chuàng)業(yè)賽道,已經(jīng)分出了兩撥創(chuàng)業(yè)者,走出不同條路線。
一條是技術路線,訓練大模型,把底層技術牢牢掌握在自身的手里,做底層,做平臺。但門檻極高,創(chuàng)業(yè)公司在底層大模型方面取得突破的難度和成本都會很高。
另一條就是面向需求和場景,走產(chǎn)品、應用、工具平臺的路線,集成開源和開放的現(xiàn)有技術,先入場再發(fā)展壯大,這也是更多中小創(chuàng)業(yè)者和開發(fā)者最可見的機遇。
這兩種路線也不稀奇。
一如當初蘋果做出了iOS系統(tǒng),有人對標iOS,要研發(fā)新手機系統(tǒng),建立新生態(tài);也有許許多多的開發(fā)者基于iOS做各種創(chuàng)造,在游戲、開發(fā)、創(chuàng)作、工具類別下瘋狂推出各種適配iOS系統(tǒng)的App。
所以技術和應用兩條道路,都能有玩家走到最后,完成商業(yè)化閉環(huán),選擇不同而已,沒有優(yōu)劣之分。
從來沒有事實能篤定表明,其中某一種能一統(tǒng)天下。
據(jù)透露,走產(chǎn)品應用路線的一幀秒創(chuàng),已經(jīng)快速積累了近200萬用戶,每日的視頻生成量在10萬級——這算不算AIGC時代的船票還不好說,但至少讓外界看到變數(shù)發(fā)生的可能。
關鍵詞:
網(wǎng)站首頁 |網(wǎng)站簡介 | 關于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權所有 未經(jīng)書面授權 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com