第兩百六十七章 概念

投票推薦 加入書籤 小說報錯

  現在看起來,無論從整體概念還是具體細節上,「全真網際網路」都與「元宇宙」概念十分類似。

  2020年4月,Epic Games旗下射擊遊戲《堡壘之夜》,在遊戲中為美聯邦嘻哈歌手Travis Scott舉辦了一場線上虛擬演唱會,吸引了超過一千兩百萬名玩家在線參加,震驚全網。

  自此,元宇宙概念真正開始引爆。

  國內方面,也不甘落後。

  前幾年三月,移動沙盒平台開發商MetaApp宣布完成一億美元C輪融資,SIG海納亞洲資本領投。

  這家公司公司號稱要打造全年齡段的元宇宙世界。這筆融資,也是迄今國內元宇宙賽道最大規模的單筆融資。

  4月20日,遊戲引擎研發商代碼乾坤獲字節跳動近一億人民幣的戰略投資。

  5月28日,雲遊戲技術服務商海馬雲完成近三億元人民幣新一輪融資。

  ……

  Facebook的扎克伯格提出,在未來五年左右的時間裡,要將Facebook從一家社交媒體公司轉變為一家元宇宙公司。

  知名硬體廠商英偉達則專門推出了虛擬協作平台Omniverse,號稱是工程師的元宇宙。

  黃仁勛說:「我們正處在元宇宙的風口浪尖上」,「Omniverse是打造元宇宙重要的組成部分」。

  其實,現在應該也看明白了,大力為元宇宙搖旗吶喊的,要麼是遊戲軟體公司,要麼是遊戲硬體公司,要麼是社交網絡公司,再就是區塊鏈公司。

  站台背書的背後,都是有一定的利益關聯。

  當然了也有專家認為,隨著數位技術的發展,人類未來一定會完成從現實宇宙向元宇宙的數位化遷徙。

  整個遷徙過程,分為三個階段,分別是:數字孿生、數字原生和虛實相生。

  數位化遷徙之後,數字空間元宇宙裡面會形成一整套經濟和社會體系,產生新的貨幣市場、資本市場和商品市場。

  人類在元宇宙裡面的數字分身,將會永生。

  也就是即便現實中的肉體湮滅,數字世界的你,仍然會在元宇宙中繼續生活下去,保留真實世界裡你的性格、行為邏輯,甚至記憶。

  如果真的是這樣,元宇宙帶來的,就不僅僅是技術問題,而是倫理問題——數字的我,究竟是不是我?他是否能夠履行人類的權利和義務?是否可以繼承我的財產?是否仍是我真實世界裡孩子的父親、妻子的丈夫?

  這些問題,都需要人類不斷地思考,制定出對應的準則。

  其實人們對元宇宙背後的世界充滿好奇,也為元宇宙的價值爭論不休。

  因為所有人都想知道,元宇宙到底會給人類帶來什麼樣的改變?元宇宙的底層技術,又是什麼呢?

  畢竟從命令行到全真互聯,數字交互方式的時代變革,其實,雖然元宇宙是一個新名詞,但元宇宙背後的數字虛擬空間,對大部分人來說,都不陌生。

  早在計算機誕生的那一刻起,數字空間就已經存在了。

  在命令行的時代,我們通過一個又一個字符,與數字空間進行交互。隨著計算機軟硬體技術的不斷提升,我們很快進入了多媒體時代。

  以jpg、mp3、mov為代表的多媒體文件,衝擊著用戶的視覺和聽覺,還孵化了遊戲產業,將人類對數字世界的感官體驗,推向了更高的層級。

  進入二十一世紀後,人類的算力發展水平達到了前所未有的高度,音視頻技術更是日新月異。

  圖片、音頻就不用說了,視頻質量方面,一路從720p、1080p發展到2K、4K、8K,並最終催生了前所未有的人機互動模式——VR/AR(虛擬實境/增強現實)。

  VR/AR的出現,第一次讓人類感受到什麼叫做沉浸式體驗。

  我們與數字世界的交互,從單向異步,變成了雙向同步。我們向真正的數字空間生活,邁出了一大步。

  2020年,企鵝董事局主席小馬哥也是提出了「全真網際網路」。

  這個比元宇宙更早出現的概念,窺見了時代的悄然變化。

  當時的小馬哥預判,移動網際網路的發展方向是全真網際網路,「從實時通信到音視頻等一系列基礎技術已經準備好」,「虛擬世界和真實世界的大門已經打開」,「一場大洗牌即將開始」。

  毫無疑問,無論是「全真互聯」還是「元宇宙」,音視頻技術仍然是底層的核心技術支撐。

  這裡不禁會想,究竟怎樣的音視頻技術,才能支撐「全真互聯」和「元宇宙」的夢想?

  人類實現真正的「虛實融合」,還需要對音視頻技術進行哪些創新改進?

  其實,音視頻技術的未來發展方向,歸根到底就是兩個,一個是「助力內容創造」,另一個是「賦能行業應用」。

  近年來,短視頻業務的爆發及全民直播的興起,將視頻發展推向了新的高潮。

  幾乎在一夜之間,我們就進入了「人人看視頻,人人拍視頻」的時代。

  如何進行優質視頻內容的創作,成為很多視頻up主非常關心的問題。

  提升拍攝技術是一方面,平台和工具是否可以發揮助力,降低內容創作的技術門檻?

  我們需要藉助虛擬空間的延伸,學生居家學習,企業居家辦公,產生了大量的網課、會議視頻流量。根據運營商的統計數據,截至2020年底,視頻在全網數據流量的占比已接近百分之七十。

  視頻不再僅僅是娛樂工具,而是變身為生產力工具。

  各個領域和各個垂直行業,都希望藉助音視頻技術的賦能,改變現有的企業經營模式,提升效率,降低成本。

  尤其是VR/AR技術,經過多年的發展,已經在文旅、教育、工業、醫療等領域有了成功的應用案例。

  越來越多的企業希望擁抱它們,但是,又對其背後的技術門檻和資源投入望而卻步。

  我們現在每天都在討論數位化轉型,其實,音視頻對垂直行業的賦能,就是企業數位化轉型的一個極佳的入口。

  究竟如何應對上面提到的音視頻發展需求和挑戰?國內網際網路巨頭企鵝,已經給出了自己的回答。

  自QQ時代以來,企鵝在音視頻通信領域已經有二十一年的技術積累。

  為了更好地進行音視頻黑科技的探索、研發及應用落地,企鵝也是專門成立了多媒體實驗室。

  多媒體實驗室通過企鵝雲,輸出通?解決?案及產品。

  2021年,企鵝全新推出「騰訊雲音視頻」品牌,就是依託於企鵝多媒體實驗室的研究成果,為客戶提供更高質量、更低成本的音視頻通信服務,共創「全真互聯」。

  首先,是智能媒體的內容生產。

  先看智能視頻。做過視頻的人都知道,視頻內容創作的大部分工作量,都集中在視頻內容剪輯和渲染上,既費時又費力。

  相比於傳統的人工剪輯,企鵝雲音視頻可以提供視頻的智能裁剪、智能綠幕替換,還可以實現智能拆條、集錦和封面。

  說白了,就是系統基於算法和學習,自動對視頻素材進行「深加工」。

  以智能裁剪為例。一個橫屏製作的視頻,如果用戶手機豎屏觀看,圖像要麼會變小,要麼會被固定裁剪,影響觀看體驗。有了智能裁剪,系統會自動識別圖像中的關鍵區域,進行最合理的裁剪,讓用戶看到關鍵內容。

  智能拆條,則是智能識別和分析視頻原始素材中人物的動作、事件和表情,自動定位精彩片段,將其提取出來,完成剪輯、配樂等工作,變成精彩視頻集錦。

  再看智能音樂,這是對音頻信號的智能識別、編創。

  具體識別對象,可以是歌曲中的鼓點、節奏點或音樂高潮。針對音樂的強度、情緒、風格、情感等維度,對音樂進行理解和打標籤。在編創時,支持將音樂中人聲、伴奏、吉他、鋼琴等音軌分離,

  智能音樂有一個非常有趣的能力,它可以自動對歌詞進行續寫,將一首流行歌改編成Rap,中文語境下支持押韻。

  基於音頻和視頻的融合,應用更為廣闊,可以實現視頻配樂、音樂MV和自動vlog。現在短視頻特別流行,通過音視頻融合,可以幫助普通創作者針對視頻提供推薦音樂、自動生成配樂,或者針對音樂找到符合情緒和律動的視頻,大幅降低作品的生產難度。

  除了內容創作以外,智能媒體還可以用於視頻修復和視頻增強。

  企鵝多媒體實驗室通過深度學習敦煌壁畫病害數據,形成自動識別並添加圖示的一整套算法,打造出高效的AI壁畫病害識別工具。

  同時企鵝訊多媒體實驗室也開啟了對老舊影像資料進行修復的工作,解決老電影抖動、劃痕、不清晰等問題,使之可以適配更高清的顯示設備。

  如果採取人工修復的方式,每人每天只能修復4、 5分鐘影片。而基於騰訊雲音視頻的智能修複方案,修復一部影片只需要幾個小時。

  再來看看沉浸媒體(也就是VR)的關鍵技術和解決方案。

  VR是元宇宙和全真互聯的核心技術,也是音視頻最具挑戰的領域。

  企鵝雲音視頻,基於企鵝多媒體實驗室研發的VR全景技術,可以實現VR360超高清點播和VR360高清實時通信兩大核心能力,提供端到端一站式全景導覽方案,包括VR園區街景導航、VR360全景景區慢直播、VR數字沙盤、VR360全景會議會展直播,等等。

  提升編解碼壓縮能力,是應用VR的關鍵。

  VR視頻因為含有三維的時間和空間信息,所以冗餘高,數據體積大,對帶寬的要求高。如果不進行適當壓縮處理,很難存儲、傳輸和計算,占用的資源會很多。

  當前有一種壓縮方式,是處理後去除25%的冗餘點,但渲染cube邊界明顯,無傳輸方面的處理。騰訊多媒體實驗室的方案,比這種更接近原片,播放時無明顯邊界。而且騰訊的方案增加了傳輸的處理,對可視區域進行切塊、渲染播放,能夠節省50%的帶寬。

  在「一部手機游雲南·VR全景點播」項目中,基於騰訊雲的雲渲染PaaS解決方案,將南頭古城以1:1的比例,超精細化還原到了雲端,任何人都可以通過小程序暢遊古城。

  在同等網絡條件下,傳統4K無切塊方案帶寬需求大於 9 MBps,而採用了騰訊的8K切塊方案後,帶寬需求小於 8 MBps。

  全景導覽方案的四大核心技術,分別是全景拼接、點雲空間重建、圖像增強、點雲數據壓縮。

  全景拼接,可以通過算法將單張照片拼接為全景照片,算法效果極佳,有效減少了畫面變形、畸變。

  圖像增強,則是通過圖像降噪、AI色彩增強技術,增強畫面色彩和細節,提升人眼的主觀效果。

  點雲空間重建,是以一個實用性很強的技術。

  它可以通過全景圖景深估計,重建空間點雲模型,展示空間結構。因為算法經過優化,數據可以壓縮至原來的六分之一,同時保持主觀視覺一致,非常適配移動端展示。

  基於點雲重建的物體數位化技術,通過非接觸式的數據採集,能夠重建物體的數字模型,形成數字檔案。這一技術,非常適合文物的數據採集、存檔和展示,降低文物損壞風險。在零售行業,這些技術也可用於商品信息的採集、歸檔。

  還是前面提到的敦煌研究院合作項目,沉浸式VR遠程會診,基於多媒體實驗室的高性能編解碼直播引擎,用4K超清畫質的360度沉浸式畫面,無死角展示洞窟內的景象和文物的細節。

  企鵝雲音視頻解決方案涵蓋了智能採集、數據處理和渲染展示等多個環節,具備全景漫遊、熱點交互、多模式切換、沉浸式展示等多種實用功能。對用戶來說,使用過程非常簡單。

  正如前面所說,音視頻技術的研發,是對解決方案提供商綜合能力的考驗,離不開長期的資源投入和能力沉澱。

  說白了,先進的數據壓縮算法,強悍的算力硬體,對5G、AI等技術的掌握和運用,是一個優秀音視頻解決方案企業的必備條件。

章節目錄