Sora(OpenAI推出的文生視頻大模型)火爆的當(dāng)下,國內(nèi)大模型企業(yè)如何追趕Sora,難點(diǎn)在哪兒?
360集團(tuán)創(chuàng)始人周鴻祎近日在接受新京報貝殼財經(jīng)記者采訪時表示,Sora的技術(shù)路線如果被開源,國內(nèi)將能很快趕上,但在追趕Sora時,算力有可能成為門檻,對此,集中國內(nèi)所有AI企業(yè)的算力或許是方法之一。
360集團(tuán)創(chuàng)始人周鴻祎。受訪者供圖
Sora確定了技術(shù)路線,但工程化思路仍需探索
Sora發(fā)布后,周鴻祎曾一連發(fā)了十多條視頻談?wù)撨@一文生視頻大模型,他認(rèn)為Sora對物理世界的很多描述符合常識,符合人類對世界的認(rèn)識,因此不能把Sora僅看作一個文生視頻的工具,而要看到背后人工智能的發(fā)展。
對于Sora采用的技術(shù),周鴻祎稱目前Pika、Runway等文生視頻公司可能只是使用了文生圖模型的相關(guān)技術(shù),但Sora將文生圖模型技術(shù)與文生文模型技術(shù)結(jié)合了起來,因此才能達(dá)到令人驚嘆的效果。
周鴻祎對貝殼財經(jīng)記者表示,Sora所代表的技術(shù)路線出爐后,國外也有兩條路線的斗爭,一條是OpenAI(美國開放人工智能研究中心)的閉源,另一條是以Meta(Facebook臉書母公司)為代表的開源,“開源路線的目標(biāo)就是要打破閉源,他們會不斷去猜測閉源是怎么做的,最后再開源出來。開源出來的好處是,很多小公司和大公司的個人成員會積極地在開源項(xiàng)目中借鑒他人成果,同時再貢獻(xiàn)自己的成果,其化學(xué)作用會非常明顯。”
在他看來,一旦Sora的技術(shù)被開源出來,國內(nèi)就能很快趕上。一個可供參考的事實(shí)是,一年前的今天ChatGPT(人工智能聊天機(jī)器人)沖擊科技圈,而國內(nèi)企業(yè)僅用了不到一年的時間就達(dá)到了GPT3.5的技術(shù)水平。
周鴻祎告訴貝殼財經(jīng)記者,他跟很多AI(人工智能)專家有過交流,發(fā)現(xiàn)目前許多技術(shù)里用到的模型和算法都是公開的,他認(rèn)為OpenAI最大的能力一個是找方向,另一個就是工程化思路非常嚴(yán)謹(jǐn)。因此,現(xiàn)在需要把工程化的思路探索出來,“此前大家學(xué)習(xí)ChatGPT的過程中,同樣也是在方向已確定的情況下,解決‘具體一個坎怎么過’‘碰到一個山怎么翻’,踩很多坑,驗(yàn)證許多具體的方法,這需要時間。”
周鴻祎坦言,和美國相比,中國在AI技術(shù)上存在差距是客觀事實(shí),“盡管在刷榜的成績里,國產(chǎn)大模型基本壟斷了Top1到Top10,GPT-4都被刷到10名開外去了。但是Sora的問世還是給了我們一桶清醒的冷水。”
“我覺得OpenAI手里還有一些秘密武器沒有亮出來,比如GPT-5,這個什么時候發(fā)布,完全取決于山姆·奧特曼(OpenAI首席執(zhí)行官)的心情和他的節(jié)奏感。”周鴻祎預(yù)測。
面對與OpenAI的差距,周鴻祎認(rèn)為只有正視差距,才能進(jìn)行追趕。在他看來,中國企業(yè)在AI領(lǐng)域與頭部企業(yè)的差距并沒有想象的那么大,因?yàn)闊o論是Transformer模型還是Sora,本質(zhì)上還是軟件,所以這個差距在掌握方向之后,可能用一到兩年的時間就可以解決。
Sora可能會生成更長視頻,國內(nèi)追趕應(yīng)集中算力
周鴻祎同時認(rèn)為,在追趕Sora方面,算力可能也是一個坎。
此前,有專家分析稱,Sora的參數(shù)規(guī)模不大,約為30億。對此周鴻祎持反對態(tài)度,“這就弄錯了一個概念,視頻的參數(shù)和文本的參數(shù)是不能簡單做對比的,文本有10萬字,視頻只有640×480,它兩個所占的存儲量完全不在一個數(shù)量級上,所以Sora可能不僅有30億參數(shù)。第二就算只有30億參數(shù),視頻分析對算力的消耗應(yīng)該是遠(yuǎn)遠(yuǎn)超過千億模型的。所以,當(dāng)現(xiàn)在國內(nèi)顯卡都被卡脖子之后,算力就可能會是一個問題。”
“Sora為什么只能做1分鐘視頻,我猜測因?yàn)樗?秒6秒有本質(zhì)的差別,4秒和6秒是因?yàn)槿坑孟袼貋砩桑瑳]有這個世界的知識。4、6秒之后這個圖怎么樣?你就想不出來了。”周鴻祎猜測,Sora能生成一分鐘的視頻,就意味著也能生成10分鐘、60分鐘的視頻,但是為什么不做呢?是由于算力和成本的限制。
同樣,算力問題也出現(xiàn)在中國的AI行業(yè)中。對此,周鴻祎表示,他正在思考是否要提出如下建議,“目前,Meta已經(jīng)有50萬塊GPU,明年可能會買百萬塊,微軟應(yīng)該也會按照百萬級別去下訂單。而國內(nèi)的所有人工智能公司加在一起可能有50萬塊GPU,但都分散在各個公司里。”
他在考慮,是否能夠把國內(nèi)的GPU算力都集中起來,“我之所以最近一直在科普,是因?yàn)镾ora不僅僅是一個文生視頻的工具,如果是的話我們落后就落后了,無非是廣告落后一點(diǎn)、電影拍得慢一點(diǎn),這些落后除了可能對娛樂業(yè)造成影響外,不會影響大國競爭,但實(shí)際上Sora預(yù)示著AGI(通用人工智能)的一個關(guān)鍵節(jié)點(diǎn),所以我認(rèn)為這對國家很重要。”
AI對行業(yè)有正向的推動,需要科普教育
此外,周鴻祎也談及了當(dāng)前公眾對AI可能“顛覆行業(yè)”的焦慮,以及由此引發(fā)的AI“賣課”現(xiàn)象和網(wǎng)友拿李一舟比作山姆·奧特曼引發(fā)的爭議。
在他看來,即便存在諸多問題,李一舟還能賣那么多課,說明大家需要科普教育,“許多人談到AI時是有恐懼的,比如AI會帶來行業(yè)崩潰,但只要去用AI就會發(fā)現(xiàn)AI是人類最好的朋友和工具,它可以讓人們解鎖技能,比如用AI畫畫、做視頻等。AI不會帶來行業(yè)的崩潰,而是會對行業(yè)有正向的推動,一定要自己去用才能知道AI是什么。”
但周鴻祎認(rèn)為,有時講這些道理“沒有用”,因?yàn)椤艾F(xiàn)在只要一個攝像頭,人就可以去網(wǎng)上講話,別人也不知道誰對誰錯”。在他看來,目前有兩種觀點(diǎn),AI恐懼論和AI萬能論,這兩種觀點(diǎn)都是不可取的。
周鴻祎表示,現(xiàn)在企業(yè)對AI普遍都比較向往,但不知道從何切入,特別是非AI企業(yè)和AI距離還比較遠(yuǎn)。企業(yè)應(yīng)該首先建立AI信仰,這要分三步走。
第一步,企業(yè)先不要著急把AI和自己的業(yè)務(wù)做整合,而是先熟悉AI。“企業(yè)可以先搞一個私有化的通用大模型,這個模型不解決任何直接業(yè)務(wù)問題,但它具備通用大模型常見的能力,目的是讓企業(yè)員工和領(lǐng)導(dǎo)先用上,進(jìn)而去熟悉和了解大模型。”
第二步,企業(yè)在定制AI前,要把企業(yè)大數(shù)據(jù)平臺升級為企業(yè)的知識平臺。因?yàn)槠髽I(yè)要訓(xùn)練AI,首先要有相應(yīng)的知識,但是很多知識都屬于“暗知識”,這些知識在外面互聯(lián)網(wǎng)上是找不到的,只有企業(yè)才有,但也分散在不同員工的電腦、郵件和聊天記錄里,要把這些“暗知識”全部匯總起來。
第三步,有了知識平臺后,企業(yè)要在業(yè)務(wù)中選擇幾個小場景,然后先訓(xùn)練一些垂直小模型來跟業(yè)務(wù)結(jié)合,后面再逐漸把企業(yè)的業(yè)務(wù)用大模型進(jìn)行賦能。在周鴻祎看來,“做這件事的過程,就是提升新質(zhì)生產(chǎn)力的一個重要體現(xiàn)”。
在他看來,大模型一定要進(jìn)入到千行百業(yè),與具體業(yè)務(wù)和產(chǎn)品功能相結(jié)合,不僅要有大腦,還要有專業(yè)領(lǐng)域知識,就像長出了“手”和“腳”,在一些垂直領(lǐng)域,大模型的能力超過GPT-4完全是有可能的,“不需要大家都去開發(fā)大千億萬億的模型,只做百億規(guī)模的模型也很有價值,同時這樣的成本企業(yè)也能夠負(fù)擔(dān)。”
新京報貝殼財經(jīng)記者羅亦丹
編輯張冰校對楊許麗
本文鏈接:http://www.rrqrq.com/showinfo-40-3593-0.html周鴻祎:算力是國內(nèi)企業(yè)追趕Sora的關(guān)鍵挑戰(zhàn)
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com