撰文|王碩果 江昱玢 編輯|江昱玢
95後杭州少女領銜,ai視頻生成賽道,新星閃耀。
6月上旬,pika拿到8000萬美元b輪融資。
這家硅谷創業公司,成立僅一年,已完成了5輪融資,背後站着硅谷一眾明星資方。
創始人是兩位“學霸”女生——郭文景和孟辰霖,均為斯坦福大學ai lab博士生。
郭文景的父親是上市軟件公司信達雅的實控人,母親則畢業於美國麻省理工大學。
4月,pika入選福布斯ai 50強榜單。據透露,新一輪融資後,公司估值將超4.7億美元,接近35億元人民幣。
以小勝大
在對話框中輸入“馬斯克穿着太空服,3d動畫”,“宇航員”馬斯克便立馬出現在屏幕上,身後的spacex火箭噴射火焰、騰空而起——這是一段pika 1.0的demo(小樣)宣傳視頻。
去年11月,郭文景團隊發布了這款文生視頻產品,以電影般的質感、動畫級的特效,引起關注。
pika 1.0能生成3d動畫、動漫、卡通和電影等各種風格的視頻,用戶還能在生成的視頻基礎上,再次輸入簡短指令,修改視頻局部,或進行畫布延展、時長拓展等編輯。
郭文景的制勝方法是“以小勝大”,即用更少的資源,得到更好的效果。
她解釋,視頻是一種高維的數據,比如,每秒24幀的1080p視頻,分辨率是1920×1080,每秒的維度達到1.5億,再乘以視頻時長,ai處理這一數據量級非常困難。
“視頻的每一個維度,是相互關聯的。”郭文景團隊抓住了這一特點。
“我們只需要知道第一幀的信息,比如,人走路的背景,他的穿着細節,後面的幀就不需要完整畫面。”
換言之,團隊放棄大規模訓練ai高維度數據,而是集中精力研究高效架構和數據壓縮方法。
這個方法能去掉90%的冗餘信息,節省算力,降低訓練模型的成本,還能呈現更好效果。
郭文景還將運動先驗、圖像先驗等嵌入到pika 1.0的模型里。
所謂“先驗”,是指對常見模式或行為的預先理解,以幫助模型更好地理解和預測視頻中的內容。
例如,用戶想要一段某人以某種特定姿勢走路的視頻,用語言描述有困難。解決方法是,提供一個引導,類如一個走路姿勢的參考視頻,作為第一幀,方便用戶把控生成效果。
“我們想建立像人類思考一樣的模型。”
郭文景根據用戶建議,2月上線功能組件lip sync,支持視頻人物嘴部動畫和音頻同步,用戶可輸入文字生成音頻或上傳自己的音頻。
“未來幾年,生成和編輯視頻,跟現在用手機p圖一樣簡單。”
天才組隊
郭文景是名副其實的“科二代”。
母親畢業於麻省理工學院計算機系,父親郭華強碩士畢業於浙江大學,現為信雅達的實控人。
郭文景高中在杭州二中讀競賽班,曾受麻省理工邀請參加北美編程邀請賽,獲第二名,對手是哈佛、斯坦福等大學代表隊。
本科和碩士就讀於哈佛,郭學業之餘,在微軟、谷歌等實習,大二時還在meta的ai研究部門任工程師,後進入斯坦福大學ai實驗室,攻讀博士。
成立pika的想法,萌生於讀博期間的一次比賽。
郭文景參加ai視頻老牌企業runway的首屆ai電影節,發現runway和adobe photoshop的工具不好用,她想,能否自己開發一款“更好用、更聰明的”ai視頻生成工具。
去年4月,郭文景和同學孟辰霖從斯坦福退學,成立了pika。
郭文景(左)和孟辰霖
體量雖小,全員天才。
聯合創始人孟辰霖發表多篇論文,其中的降噪擴散隱式模型(ddim),已成為業界內容生成的默認方法,被openai、谷歌等使用。
創始團隊中的陳思禹,與郭文景是杭州二中的同班同學,也是信息學和物理兩門學科的國家集訓隊成員,本科保送北大圖靈班。
當下,pika僅13人隊伍,有6位ioi(國際信息學奧賽)金牌得主,其中3位是世界第一。
pika的顧問陣容,同樣星光熠熠:christopher manning,斯坦福ai實驗室主任;ron fedkiw,兩屆奧斯卡科學技術獎得主……
“我們每天都在跟openai和elon musk搶人。”郭文景求賢若渴,“我們想做下一個sora,甚至超過sora,讓大佬充分發揮。”
行業領頭人協同作戰,團隊運轉高效。
某次,一位天使投資人向團隊提出,在視頻中嵌入文本的想法。凌晨3點,他收到回復,稱這項功能已準備就緒。這位投資人立刻決定,對pika進行下一輪投資。
“我們會更aggressive(聲勢浩大)地做視頻大模型,”郭文景表示,pika計劃此輪融資後,快速擴張研究和工程師團隊。
4月,adobe宣布在視頻編輯工具 premiere中嵌入三大外部合作商,openai、runway以及pika。
商業突圍
對比sora的視頻生成最長60秒,國產文生視頻大模型vidu的16秒,pika僅4秒。
足夠的時長,是敘述和情節展開的基礎——這是後起新秀必解的題。
“視頻時長有突破,達到60秒不是難事。”郭文景透露。
pika當前用戶達數百萬,每周生成數百萬個視頻。
關注度出現下滑。
similarweb數據顯示,4月,pika網站訪問量為200萬,較其最高點下降64%。
好在,資本依舊青睞。
pika最新的8000萬美元b輪融資,由spark capital領投,公司估值超4.7億美元,比上一輪翻了一倍。
郭文景帶隊已完成五輪融資,總融資額達1.35億美元,約合10億元人民幣。
投資方几乎集齊了硅谷的一眾大佬,包括quora創始人 adam d'angelo,github 前ceo nat friedman,硅谷投資人daniel gross等。
郭文景已展開商業化探索,pika的收益主要來自會員訂閱費用。
1月起,公司產品開始付費。官網顯示,按月訂閱分為標準版和專業版兩檔,分別收取10美元/月和60美元/月。
“我認為to c在美國還有機會,如果10萬用戶願意每月付100美元,我們就有1億美元收入。”郭文景坦言,通過c端盈利,在國內挺難。
她透露,當下,pika生成一個3秒的視頻,成本遠低於sora。
“如果刨除大模型訓練投入和gpu(圖形處理器)成本,公司整體是profitable(盈利的)。”郭說。
要緊的是,推出下一個讓人眼前一亮的新品。
據悉,pika將在年內發布重大更新,新產品的升級重點是其“可控性”。
青年學霸、業界頂流們組隊,這匹ai黑馬疾馳向前。
“跟openai是有差異的,我們的目標不是做agi(人工通用智能),而是做服務創作者的產品。本質是幫大家實現創意。”郭文景談到。