「網際網路要完蛋了,只有我們能救它」

你有多久沒聽到一家創業公司說自己要拯救網際網路了。

今天的創業者似乎要麼悶聲賺錢,要麼在討論用AI拯救(或者毀滅)全人類。我們每天都生活其中的網際網路,似乎早就沒人關心他的死活了。

而在Chri看起來,它就要死了。

而在Chri看起來,它就要死了

我在聖何塞明媚的陽光下聽他這麼對我說的時候,感覺有點聳人聽聞。不過當你跟這個頭髮像獅子一樣炸向四方的德國人待久了,他那邏輯嚴謹的德國味兒英語很容易會讓你覺得,這的確是個大問題。

Chri Besenbruch是Deep Render公司的聯合創始人兼CEO,簡單來說,他的公司在做的事情,就是「用AI來把視訊檔案的大小壓縮到非常小」。

他聲稱這個演算法比行業標準編解碼器HVEC「好」多達五倍,不過他沒有具體說明用什麼標準衡量,並且可以在高通、蘋果和英偉達等現代晶片組上實時運行。所謂的「編解碼器」是指能夠編碼和解碼資料的軟體,有時也是硬體,通常用於音訊或視訊資料。

有些熟悉矽谷的人聽到這可能會恍惚,以為我在複述《矽谷》的劇本,在這部被形容為完美展現矽谷創業生態的美劇裡,一切鬧劇都因為主人公開發出了驚人的壓縮演算法。

「是的,很多人跟我說過這個。我們確實很像pied piper。」這個德國長大,本科修讀數學,又跑去瑞士讀藝術學院,再去英國學計算機的背景複雜人士,和《矽谷》裡的主角Richard一樣有濃濃的nerd氣息,但與電視劇裡荒謬的壓縮演算法突破過程不同、與電視劇裡Richard缺少商業常識經常舉棋不定不同,他的創業近乎解數學題一樣嚴謹,他對公司的商業模式也想的很清楚。

在他看來,網際網路正在走向毀滅,這就是最大的問題。他想解決這個最大的問題,一通分析後,他們認為根本原因是老的技術不適應新的世界:

從視訊流行,成為網際網路溝通交流的主要形式後,我們其實進入了新的世界。一個資料規模量級越來越恐怖,且不會回頭的世界。

舊技術已經不適應這個新世界。沿著老路一直做微小的創新和改進,只會走向絕路,最終是網際網路的大崩潰。

「我們要拯救網際網路,方法是發明新的壓縮演算法。而讓這成為可能的就是AI。」

沿著這個思路,Chri和他在英國的研究生同學一起在2018年創辦了Deep Render——他並不是那些追逐ChatGPT浪潮的創業公司。

「基本上我們和LLM關係不大,可能和擴散模型有關,但更多是未來的潛在可能。」他對我說。「我們從第一性原理出發,想明白AI適合做的和壓縮這件事的本質,最終認為完全依賴AI的方法必定是新的技術路線。」

不過,LLM帶來「焦躁」事實上幫助了它的公司。「我們當時其實有賭的成分,因為要實現我們的目標,除了我自己有演算法,還需要軟硬體的大幅進步,我們當時做了一個預想,設想這些基礎技術都能躍進。而今天這些都發生了。」他對我說,語氣充滿興奮。

「可能我們就是很幸運而已。」

看起來很謙虛,但他沒有說的是,如果他的預想都會成真,他的公司可能會是未來幾十年人類最重要的網際網路技術公司之一。他們的技術會以授權形式提供給各大公司,解決網際網路頻寬問題的同時,他們也會成為收水電費和收稅的那類公司。

而事實上,一切已經開始變得不同。

今年以來,這家一直乏人問津的公司進入了矽谷和全球知名的投資機構的視野,在3月完成一筆融資後,Chri開始把重心轉移到矽谷,這裡有錢,也有對他們充滿興趣的大客戶。

根據他的表述,目前他們規模不大的團隊在面對來自「不能透露名字但都是很重要的大公司」的興趣和需求時,已經忙不過來了。

而他跟我透露,如果現在一切進展順利,2024年二季度,就能在一個非常知名的應用服務裡用到它的技術。

「幾千萬使用者將會有機會使用它。」

而對視訊和資料壓縮需求巨大的中國市場,也開始以各種樣貌出現在這個還沒去過中國的CEO的面前。

「我們有很多與中國有很強關聯的投資人朋友,在幫中國的一些公司聯繫我們。我們已經在接觸幾家中國最大的網際網路公司。」他說。這些需求來得突然而迅猛,以至於他花了半天時間在跟我打聽「與中國網際網路公司共事是什麼樣」的基礎問題。

「看來你要拯救網際網路,沒有中國市場也是不行的。」我儘可能給這個大部分時間生活在歐洲的科技創業者講了東方的故事後,跟他半開玩笑地說。

「你說的對。」他笑著回答。不過在思考中國市場之前,他先要征服矽谷。

在美劇《矽谷》的結尾,Richard的公司在歷經6年的坎坷創業後,已經估值達到80億美金,但就在產品正式發佈前幾天,他們發現,這個壓縮演算法和他們開發的用來改進網路的AI互相改進,變成了一個他們也無法理解但能夠攻破一切系統的「怪物」,在權衡後他們最終決定「拯救世界」——方法是用一場華麗的出醜讓所有人不再對這個技術路線有念想。

對於一場創業來說,這並不是什麼好的結局。當我把這個話題拋給明年也要到創業第六年Chri時,他想了一會,然後只是笑著說:

「希望我們的結局更好吧。」

以下為對話實錄

Q: 簡單介紹一下你和你的公司吧

A:當然。我是Chri Besenbruch,Deep Render的CEO和聯合創始人。Deep Render在做的事情,基本上就是在把視訊檔案等的大小壓縮到非常非常小。為什麼我們要做這件事,是因為現在網際網路上的資料在指數級的增長,90%的資料是過去兩年裡產生出來的。它們需要通過世界各地的光纖網路傳播,在如此大的規模之下,這是一個非常昂貴的基礎設施。這個世界的整個光纖基礎設施耗費了5萬億。這並不讓人感到舒服,因為如果資料每兩年翻一倍,對基礎設施又意味著什麼,它也需要翻倍。但這可是萬億級別的翻倍。這就是個不可能的事。這是我做這個事的起因。

我們的想法是,如果我們不能讓管道變得更大更快,我們就讓管道里的資料變得更小。於是就指向了壓縮。這是我們的根基和願景。

Q: 所以你是先推匯出了一個今天網際網路面對的最核心問題,以及想出了它的解決方法,然後用它確定你的創業方向。

A: 對,就是這樣。因為如果沒有一個大幅提高的更好的壓縮方法,整個網際網路很快就要崩潰。而我愛網際網路,我想讓它繼續運轉下去。

Q:那麼你們的技術到底有何不同,因為壓縮並不是新的東西,它存在很久了,人們甚至已經習慣並且忘了它的存在。也許你可以用傻瓜也能懂的話介紹一下你們的技術。

A: 哈哈哈,我盡力。我們需要從過去60年來看整個產業,當傳統的壓縮技術出現時,它是個巨大的突破,一切都是基於DCT(DCT代表離散餘弦變換,Discrete Cosine Transform,它將圖像分成由不同頻率組成的小塊。在量化過程中,捨棄高頻分量,剩下的低頻分量被保存下來並用於後面的圖像重建。編者注),這個讓今天的視訊壓縮技術成為可能的方法發明於1970,1980年代左右,之後它主導了這個行業。但之後這個技術每10年只有一點點進步,而且它一直是同一個技術思路。我們不能指望一個技術在同一個思路里迭代幾百次就能實現效果的飛躍。它是很棒的技術,但只不過它的創新週期結束了或者正在結束。

所以我們需要新的東西。而這個「新」就是AI。因為AI能很好處理圖像和視訊,所以這並不是什麼難以想到的路線。於是AI技術和壓縮技術開始結合。之後有兩股浪潮,第一股發生在2017年,超解析度出現,Magic Pony公司發明了它,他們的想法是在管道的中間保留傳統的壓縮方式,在前後各加入AI。

Deep Render不認為這是正確的做法。因為它中間保留的是我們認定已經徹底崩壞了的傳統壓縮技術。它與以前的相比沒怎麼變,而且還很難真正有用。

我們是第二波浪潮,徹底拋棄傳統壓縮技術,只是用神經網路,這也意味著要重新發明壓縮,圍繞著機器學習技術重新發明的壓縮有最高的效果,神經網路拿到資料,壓縮檔案,發送到網際網路,網路收下壓縮檔案還給你視訊。這是一個只用AI的解決方案。我們在引領這股浪潮,其實我們也是唯一這樣做的公司。

Q:所以基本上你是用AI替代了傳統技術負責的那部分,那麼為什麼AI可以,且可以做得更好?

A:兩個原因。視訊或者說視訊壓縮本質上就是在檔案大小和圖片質量之間做取捨(trade- off)。你要麼是非常大的檔案和好看的視訊,要麼是非常小的檔案很爛的清晰度。所以好的壓縮就是好的取捨。在檔案大小方面,關鍵在於資料冗餘的部分(redundancy)如果你可以預測下一個像素是什麼,你就不需要傳送冗餘資料,就能節省檔案大小。這是AI能夠做更好預測的一個地方,預測的好,冗餘就可以去掉,就能接收更少資料。而AI根本上就是更強,因為它會對資料做出反應。

二是關於視訊質量。任何壓縮演算法都會在視訊輸出時帶來錯誤,這就是有失真壓縮的定義定義,為了更小檔案大小而接受一些錯誤。但對人類來說,真正重要的是這些錯誤的分佈,我們對某些會更敏感,對其他可能就沒事。所以我們的AI模仿人類視覺系統,讓這些錯誤對於人類來說是藏起來的。

一個很棒的例子是,人們討厭線條變得模糊,如果一個銳利的線條變得模糊人們會感覺不快,因為這是生物學決定的。比如當一個老虎從石頭後面開始移動,我們需要能看到它,我們會盯著它。而顏色的準確度就不一定了,如果有損失也沒人真正注意到。所以你可以色彩準確度讓渡一些但不要模糊邊緣。人們就更喜歡這樣的視訊質量。

我們的思路永遠是,從第一性原理入手,什麼是合理的,背後的數學原理是什麼,哪些工具可以用來解決真的問題。AI正好就是這個最合適的工具。

Q:很有意思,所以這是最基礎的思路,接下來就是執行了。作為一個五年的公司,今天的AI變革對你們有衝擊麼。

A:軟體層面我們其實一直紮根在研究圈,我們的軟體產品來自研究圈子。今天的AI的變化對我們沒什麼衝擊,我從2015年當AI革命開始時就紮在這些研究圈了。

反而是硬體層面其實是更加新鮮的。我們有很棒的軟體層面的壓縮技術但過去只能在雲端運作,那這就只能算是個不錯的研究課題,而不是一個產品。只有當它進入到各個終端讓千萬人能在自己的設備上用到它,才成為產品。

因此我們當初其實也做了一個對未來技術變化的賭注,除了賭AI會起效果,也賭我們需要的硬體會出現,特定的AI加速硬體,比如NPU,比如蘋果高通和Google的各種硬體晶片會造出來。我們在2018年下了注,今天2023年我們果然有了。

要麼是我們有很好的視野,要麼就是運氣好。

Q:而且這些硬體大廠也在對你們產生興趣。

A對因為他們有了這些硬體,開始找killer app。我們找到他們說,嘿,每個人都看視訊,我們這個就是你要的killer app。這個時間點也很合適。

Q:演算法之外,我們之前聊天你提到資料也是一個門檻,但顯然大公司掌握更多的資料,這會是個問題嗎。

A:很有意思的問題。(沉思)我認為對於AI壓縮,最終會發現演算法更重要。因為我認為整個領域還不夠成熟到需要資料質量決定的階段。

Q:所以那是第二階段的問題。

A:對,現在還在第一階段,我們都不能說有了完美的演算法,我們的演算法每個月都在大幅進步,變化非常非常快。當演算法很強了,才是資料。不過我們也在積累,因為資料是回報遞減的,現在我們有一兩百萬的視訊序列資料,我們從開源可信的渠道獲得或者從視訊網站購買,在這個節點它們還挺開放的,但大家都看到ChatGPT讓這些開放度在改變,我們很幸運更早的買到了這些資料,這也是個優勢但不是這個階段的真正決定性的優勢。

Q:LLM和擴散模型給你的演算法帶來新東西了嗎。

A:比較少,有一些思路有借鑑,問題是,這些模型看起來可以進入我們的流程個我們帶來提高,比如Stable Diffusion可能可以幫我提高壓縮能力,但還是取捨——比如SD10秒處理一次,而我們需要10秒處理300次,如何在實時和效果之間取捨是問題。未來它們有潛力帶來影響。

Q:如果我們從競爭的角度看,目前你的挑戰來自哪裡?

A:演算法,然後背後是人。我們很多基礎演算法是自己研究,因為沒有多少論文可以看。最關鍵的挑戰就是組建好的團隊,因為市場上有很多人研究AI,沒那麼多人研究資訊論,而同時研究兩者的幾乎為零。所以我們需要組隊然後訓練他們,這需要很長時間,因為它們彼此關聯不大。所以你需要先訓練一批人,再讓他們帶下面的人,這是個金字塔結構。

Q:你們已經建立了這個金字塔麼。

A:我們有超過30個AI研究超級明星了。但我們為此花費了很長很長的時間。

Q:所以世界唯一的30個人都在你這。

A:我願意這麼說。也有一些實驗室在看這些話題,他們也有很好的人才,但目前為止在規模上,Deep Render是這個領域最大規模的組織。

Q:我看到你提到要用最近新的融資來擴展矽谷的生意和存在感。

A:對這是有點奇怪,我們是英國公司,但使用網際網路資源最多的公司在中國和美國。而且,歐洲確實不是一個對科技發展友好的地方。我們有很多來自美國的需求,所以進入美國順理成章,中國也是一樣。

Q:有中國客戶接觸你們麼。

A我不能說名字,我簽了很長很長的協議所以我要小心哈哈。但我接觸這些公司,發現中國確實在頻寬上的需求比美國都更高。

Q: 你們已經在接觸客戶,如果用人們喜歡討論的PMF來判斷,你們現在到了什麼階段

A:這總是很難去定義。我會認為我們達到了PMF,因為我們拿到的需求已經處理不完了。我們真的在拒絕很多大公司,因為我們自己有的頻寬資源不夠了,許多公司預定我們,而我們現在只能同時處理4到5個大公司的需求。一旦這個技術再更成熟一點,商業化就更容易了。我們已經度過了概念驗證階段。如果一切順利,2024年二季度你能看到我們的技術被應用到一個非常知名的網際網路服務裡,到時候數千萬的使用者會使用它

Q:面對瘋狂的需求,和有限的人手,以及你們自己的技術現狀,如何平衡取捨就是你這個CEO的職責了。

Q:哈哈,這就是我這個工作的挑戰之處。我要嘗試做決定。走太快總是消耗資源,並且招聘會帶來挑戰,我們的員工一般需要4個月訓練才能有產出。所以你說的對,這是個最佳化難題,當然,可能誰用AI開發個工具我願意花錢買。

Q:哈哈,在這兒也許LLM就可以參與進來了。

A:對哈哈哈。

Q:看起來一切都進展順利,你給這個生意設計的商業模式是什麼。

A:我們目前是B2B的形式,我們給客戶提供產品授權,客戶能節省很多很多錢,裡面的一部分給我們就行。這是個基於授權的商業模型。如果你看這裡的資料,其實很瘋狂,到2030年,全世界花在傳輸內容的成本會達到1250億美元。如果你想搞垮Netflix,你就用4K,24小時不停看Netflix看一個月。

Q:最好別這樣。

A:哈哈哈,但如果你能把檔案大小縮小比如90%,那麼按照1250億美元算,公司們能節省很多很多錢。

Q: 這就是你賺錢的機會。

A:這是一個所有人都獲利的生意。我贏了,公司贏了,使用者贏了,大網際網路公司贏了。沒人損失什麼。

Q:拯救網際網路的事呢,你的公司幫忙建造的未來的網際網路的樣子,你想象過麼。

Q: 當然,每天做夢都在想象哈哈哈。我們的願景是讓頻寬變成沒有限制的商品,讓所有人不再擔心網速,對於每個人,可以在家享受極高質量的視訊,對於公司,可以獲得非常便宜甚至免費的網際網路資源,資訊可以流動,即便是今天認為很重的資料也能自由流動。這才是網際網路本來該有的未來。

Q:最後這個問題,肯定很多人跟你提過了,聊到這讓我更加有這種感覺,就是那個美劇《矽谷》裡的故事似乎和你們一樣。

A:對對對。這幾乎是我最喜歡的劇。但其實很有意思的是,我和我的聯合創始人直到創辦Deep Render一年半以後才知道這個劇,因為HBO在英國沒那麼火。但很有意思的是,我們的商業模式和我們經歷的階段,和這個劇裡的故事幾乎一樣。尤其是我們是後來才看到的,我們倆說,等一下,這不就是跟我們一樣麼。

Q:你也知道這部劇最後的結局。

A… 哈哈哈,希望我們的結局更好吧

Source

订阅评论
提醒
guest
0 Comments
最多投票
最新 最旧
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x