尚恩 發自 凹非寺
下面這倆視訊,你能分辨出哪個是真人,哪個是AI生成的嗎?
△:注意看左圖人物背景
實際上,這倆都是100%由AI生成的人像視訊

。
現在,只用上傳一段2分鐘的小視訊,就能達到這種效果,不僅生成速度快,視訊還帶輕微動態背景。
另外像手勢、面容和口型這種「細微肢體語言」也能調整。
看到這些生成效果後,網友紛紛豎起大拇指驚呼:
太牛了,視訊製作遊戲規則要改了!

也有網友口吐芬芳直言:「數字人替我上,面試再也不緊張了」
(OS:你還挺會玩)

當然除了驚訝之餘,也有一些不同的畫風,比如這個網友就覺得:
比起興奮,自己會更擔憂技術被濫用。

主打一個逼真
上面所有這些視訊都出自HeyGen的Joshua Avatar 2.0,一款AI人像視訊的工具,主打的就是一個超逼真。

目前,HeyGen提供超過100+數字人素材和模板,廣告、電商、新聞等一應俱全,也可以自己編輯PPT生成。
還同時支持300+不同音色和40+語言,各種配音隨意玩,比如咱們來一個說法語的馬斯克:
當然了視訊畫質也不差,都是1080P的那種,電腦手機、橫屏豎屏都能hold住。此外,還設有包括「文字到視訊轉換、音訊上傳、多場景視訊、視訊共享和背景音樂選項」等功能。
搞一個視訊,最多隻用三步即可:
選形象、寫文字、等輸出。

儘管效果很騷,網友內測後發現有一個bug,就是數字人眨眼頻率有點兒過高:
真人5秒眨一下,數字人每秒眨50下。

不過也有網友調侃道:「說謊的人,才會一直眨眼」

。

目前,Joshua Avatar 2.0還沒完全上線,官網目前提供的還是1.0版本,手癢的朋友還需多等等。
不過好訊息是,最新版已經開放內測試了,感興趣的朋友可以先排個隊試試。
內測連結:https://am8evw00qys.typeform.com/to/wauwjUYP?typeform-source=t.co/

7個月盈收100萬美元
從目前放出視訊細節和對比市場同類AIGC工具,Joshua Avatar 2.0在逼真性方面確實做的非常不錯。
根據官網顯示,HeyGen效果之所以這麼好,主要原因產品是基於Surreal Engine去打造的,而Surreal Engine本身就是專門用於創建VR和AR體驗的,專注於生成實時人物視訊序列。
而像d-id這類則是基於GANs,GANs本身就更側重於修改和轉換已有視訊,比如面部替換、場景轉換等合成處理。

此外,HeyGen這個創業團隊也值得說道說道。
公司成立於2020年,一開始就專注於做AI數字人生成,創始人CEO曾在Snapchat擔任主要工程師,負責機器學習領域。

今年4月底,創始人Joshua Xu發了篇部落格,表示產品從2022年9月上線至今,在僅7個月內實現了100萬美元年度重複收入(ARR)。同時已經連續9個月保持穩定的月環比增長率為50%。

而且整個團隊也只有約30人,分佈在3個大陸、4個國家和6個城市,以遠端辦公進行。
目前,公司的盈利模式主要是圍繞客戶付費開展,未來也會開放API接口,提供更多團隊協作和企業功能。

另外,CEO也表示已經積累了數百萬個視訊資料,也會考慮做視訊垂直領域的大模型(LLM)。
你覺得這款工具怎麼樣?
參考連結:
[1]https://twitter.com/HeyGen_Official/ [2]https://twitter.com/joshua_xu_/status/1687129787267973123/ [3]https://www.heygen.com/article/0-1m-arr-in-7-months/