創(chuàng)投變辯辨:蘋果VS微軟,誰決定MR的未來?

●創(chuàng)投圈首檔辯論類節(jié)目創(chuàng)投變辯辨第五期辯題:MR設備的未來是VST(視頻透視)方案還是OST(光學透視)方案?

●VST代表:小派科技Pimax認為,VST正是蘋果Vision Pro所采取的透視方案,其更強的沉浸感和更高的虛實融合精度能帶來卓越的使用體驗,此外,超透鏡等新技術也將帶來頭顯的輕量化革命。

●OST代表:Rokid則認為,低成本與輕量化使基于OST的AR設備成為用戶可以日常佩戴的眼鏡形態(tài)的產(chǎn)品,能夠更快融入到公眾的社會生活之中,進而成為MR市場的主導。

MR設備透視功能有兩種技術路線。一條路線是VST,Video see through,即視頻透視,另一條路線是OST,Optical see through,即光學透視。

其實,VST和OST的路線之爭,持續(xù)了MR領域到目前為止所有的歷史,近期蘋果Vision Pro的發(fā)布,以VR加上VST作為其產(chǎn)品的核心形態(tài),在VST陣營加上了一個重重的籌碼。

但是,這是否就意味著VST和OST之間的爭論塵埃落定了?關于AR/VR的未來,蘋果有沒有可能選錯了?本場辯論《未來MR透視功能將主要依靠什么技術?》,圍繞OST和VST之爭展開討論。

本期嘉賓:

●主持人:嚴鋒,復旦大學中文系教授,科學雜志《新發(fā)現(xiàn)》榮譽主編

●VST嘉賓:翁志彬,Pimax小派科技創(chuàng)始人兼董事長,主張:未來MR透視功能將主要依靠VST(視頻透視)技術

●OST嘉賓:祝銘明,Rokid創(chuàng)始人兼CEO主張:未來MR透視功能將主要依靠OST(光學透視)技術

技術科普:

●VST(Video See Through),即視頻透視,利用攝像頭等傳感器,捕捉真實世界的影像,然后投射在屏幕上,用戶看到的一切都是虛擬設備想讓他看到的樣子,真實世界與虛擬世界都是數(shù)字信號,可以同步修改,代表性產(chǎn)品有蘋果的Vision Pro、Meta的Quest Pro;

●OST(Optical See Through),即光學透視,它就像一層玻璃,同時通過攝像頭定位和芯片計算,虛擬物品和現(xiàn)實可以產(chǎn)生交互,以真實世界為主,可以讓用戶對現(xiàn)實世界的感受更加出彩,代表性產(chǎn)品有微軟Hololens、Rokid的Max Pro

【主持人嚴鋒】大家好,我是復旦大學的嚴鋒,新媒體和虛擬技術的愛好者和研究者。我們本期《創(chuàng)投變辯辨》邀請到了兩位創(chuàng)業(yè)者,討論MR設備透視功能的兩種技術路線。

一條路線是VST(Video See Through),即視頻透視,另一條路線是OST(Optical See Through),即光學透視。

今天的嘉賓一位是祝銘明先生,他是Rokid的創(chuàng)始人和CEO,致力于人機交互技術和AR的商業(yè)化。另一位是翁志彬先生,他是Pimax小派科技創(chuàng)始人和董事長,長期從事高端VR頭顯的研發(fā)和商業(yè)化。

可以這么說,祝總是MR行業(yè)里走AR技術路徑的代表,翁總是MR行業(yè)里走VR技術路徑的代表,相信兩位在一起一定能夠擦出火花。

【VST翁志彬】從OST(光學透視)和VST(視頻透視)這兩條路線來說,VST(視頻透視)在虛實世界的無縫融合方面肯定會好一些,因此在娛樂、社交、生產(chǎn)力、辦公等場景更有優(yōu)勢,尤其是to C方面,這也是蘋果Vision Pro正在引領的路線。OST(光學透視)未來應該更適用于偏工業(yè)的使用場景。

基于這個判斷,未來MR眼鏡90%的市場份額屬于VST(視頻透視)技術。

【OST祝銘明】剛才翁總講到了,要根據(jù)場景分。如果把我們的立足點放到最近的兩年到三年,這兩個技術路線都有自己的特色。舉個例子,如果在一個要百分之百地讓虛擬物體跟真實物體進行絕對地融合的環(huán)境,比如說做一些科學實驗,做一些精度比較高的建模,VST(視頻透視)是個好的路徑。

但比如簡單玩一些游戲互動,例如文博文旅的場景對精度的要求沒有那么高,可能OST(光學透視)也就夠了,而且OST(光學透視)會更輕便。

所以最近這兩到三年,我們還是要根據(jù)場景垂直的領域來看,各自的都有自己的優(yōu)勢。這也是為什么小派和Rokid 還能活得挺好。

但是未來我們如果把時間看長遠一點,如果要一直佩戴,24小時使用,最終我們在一個理想狀態(tài)下,肯定是OST(光學透視)要優(yōu)于VST(視頻透視)。

01、VST(視頻透視)做不到小型化?OST(光學透視)做不到沉浸體驗?

【主持人嚴鋒】兩位怎么看VST(視頻透視)和OST(光學透視)各自在技術實現(xiàn)上的優(yōu)勢和挑戰(zhàn)?

【OST祝銘明】從精度講,比如VST(視頻透視)除了大家都知道的沉浸感也好,F(xiàn)OV也好,或者角度的優(yōu)勢之外,其實很多人如果不做技術,可能不大知道的一個優(yōu)勢:就是有兩個數(shù)字坐標系。總體來講,兩個數(shù)字坐標系好對齊。

第二個好處,VST(視頻透視)可以對數(shù)字化的東西進行任意改造,這是OST(光學透視)做不到的。

劣勢其實也跟它的優(yōu)勢并存。劣勢就在于:VST(視頻透視)要做沉浸式和數(shù)字化的物理世界重建。那VST(視頻透視)設備的體積、顯示系統(tǒng),整體就很難做到輕量化。這是VST(視頻透視)未來一個最大的挑戰(zhàn)。

OST(光學透視)的優(yōu)勢在于能夠輕量化。因為OST(光學透視)只針對虛擬的東西做數(shù)字化,不對物理世界進行重建。因此OST(光學透視)無論對算力的要求,對傳感器的要求,對諸多的東西都會簡化。

但正是因為這個原因,OST(光學透視)存在兩個坐標系,一個是物理坐標系,一個是數(shù)字坐標系,這兩個坐標很難校準。例如我戴上OST(光學透視)設備后,會通過數(shù)字化的東西進行校準,但換一個人戴,或者把鼻子抬高一點,變化佩戴的姿勢,OST(光學透視)設備都要重新做校準。

第二個難題:我沒辦法讓真實世界里的東西消失,或是發(fā)生改變。例如我透過OST(光學透視)設備看到一個杯子,但我沒有辦法把它抹掉,但VST(視頻透視)可以這么做。

這就是我覺得VST(視頻透視)和OST(光學透視)各自的優(yōu)缺點。短期來看大家能達成一致。長期來看,我不知道翁總的觀點。我覺得長期一定是OST(光學透視)的天下。因為要做到剛才講到的碎片化、24小時佩戴,就很難逃出OST(光學透視)的技術路線。

【VST翁志彬】??偺岬降倪@兩點,我覺得值得我們探討。從技術上,因為OST(光學透視)是真實世界的光線直接進入人眼,所以它更直接、更自然,而且?guī)缀跏橇阊訒r。但對虛擬物體而言,OST(光學透視)可能要處理延時。這意味著它在時間、空間上,兩條坐標本質上很難對齊,這是目前OST(光學透視)的一個天然缺點。

但這個缺點對于VST(視頻透視)剛好是反過來的。因為VST(視頻透視)會對真實世界的光線進行處理,在時空上可以做到很好的重疊。那么,VST(視頻透視)在感觀上會更沉浸,更直接,精度更高。

我覺得二者的應用場景可能會有一些差別。比如剛提到未來OST(光學透視)居多還是VST(視頻透視)居多?對于OST(光學透視),我非常認同??偟恼f法:產(chǎn)品一定要做輕量化。我們認為,未來的MR設備一定會小型化,而VST(視頻透視)設備占比在90%以上,量級在十億級,OST(光學透視)也會有接近億級的量。

使用VST(視頻透視)技術的MR眼鏡可以類比為五年前的Macbook Pro,性能強勁但尺寸偏大,而使用OST(光學透視)技術的MR眼鏡可以類比為Macbook Air,性能一般但尺寸較小。但最新款的Mackbook Pro尺寸已經(jīng)和Macbook Air在一個數(shù)量級上了,也就是說,Air在尺寸上的優(yōu)勢已經(jīng)不復存在,而性能又比不上Pro,用戶自然沒有理由再繼續(xù)購買Air。

同理,隨著VST(視頻透視)設備的逐步小型化,當VST(視頻透視)設備的尺寸接近OST(光學透視)設備的數(shù)量級時,OST(光學透視)設備的優(yōu)勢會逐步消失,用戶自然就不會因為尺寸而選擇OST(光學透視)了。

另外,我認為VST(視頻透視)未來一定可以做成小型化。雖然蘋果Vision Pro現(xiàn)在的體積各方面還是比較大,就像早年的大哥大,但未來它還是可以做小型化的。只是說小型化的同時,功能也一定要做強。也就是說,如果小型化是以犧牲VST(視頻透視)天然的沉浸感等優(yōu)點來說,它就不合算。

02、超透鏡方案讓VST(視頻透視)設備保持性能的同時變得更輕?

【主持人嚴鋒】??傆袥]有需要反駁或者補充的?我覺得翁總特別強調,不能為了小型化而犧牲功能,那??倢Υ吮硎就鈫?

【OST祝銘明】這個稍微有點區(qū)別。我覺得如果大家從未來生態(tài)發(fā)展的格局來看,VST(視頻透視)可能會變得比較小眾,而不會消亡掉。我個人兩個設備都會有,因為我也是重度的玩家。

但是作為普通老百姓來講,對于未來主要的通用計算平臺,OST(光學透視)的優(yōu)勢比較明顯。

我不是說OST(光學透視)會取代所有的VST(視頻透視),但從共不共存的角度來講,可能還是要看比例。就像剛才翁總講到的,如果要用VST(視頻透視)去做,把體積做小,可能就不得不犧牲一些能力,可是犧牲那些能力會不會導致VST(視頻透視)的體驗減分?這也是一個大家需要去考慮的問題。我覺得這個挑戰(zhàn)還是非常非常大的。這也是為什么Vision Pro到今天為止還是有諸多的疑慮,包括它的售價、體積、重量,散熱。連Apple這么頂級的公司在VST(視頻透視)上,做出的產(chǎn)品至少沒有真正地叫好又叫座,所以這也是不大容易的一件事情。

所以理論上,我覺得如果要犧牲一些能力,把VST(視頻透視)做小是沒問題的。那問題就在于VST(視頻透視)對減配的容忍度到底在哪里?那根線到底在哪?比如說它真的延時做得不夠好,或者是分辨率做得不夠好、不夠高,或者交互性做得不夠好,那可能VST(視頻透視)反而就變成一個負擔了,比如說戴上去會暈、坐標不一致等諸多問題。

加上我們想象一下,把眼鏡做得很小的情況下,像普通眼鏡一樣,我的肉眼既能夠看到真實世界,又能看到虛擬數(shù)字展現(xiàn)出來的真實世界,如果出現(xiàn)側面的漏光等問題反而更尷尬,用戶會覺得更加地別扭。

所以,我的觀點就是OST(光學透視)和VST(視頻透視)共存,但如果從未來的通用計算或者多數(shù)人的選擇來講,還是OST(光學透視)的天下。

這就是為什么Rokid會選擇OST(光學透視)這個技術路線,我們也是相信這么一個方向。

【VST翁志彬】我想從技術角度來看VST(視頻透視)的發(fā)展方向。

首先,蘋果Vision Pro是非常優(yōu)秀的產(chǎn)品,但它(只)是MR的一個雛形形態(tài)。

其次,我認為未來VST(視頻透視)一定能在保持性能不變的同時做到小型化,主要有幾個方向。

我們傳統(tǒng)的透鏡焦距大概是30毫米,現(xiàn)在通過Pancake方案可以做到15、13毫米左右。雖然未來用Pancake透鏡一定不可能做到3毫米的厚度,但是蘋果和我們業(yè)內都在做超透鏡方案。

在超透鏡方案下,顯示屏和透鏡能做到二合一,整個光機可以從目前的15、13毫米壓縮到2、3毫米。

所以我認為,未來5—7年左右,超透鏡方案會是個前景。一旦未來VST(視頻透視)超透鏡方案能實現(xiàn),超薄性就能實現(xiàn)。而當VST(視頻透視)的光機方案做到2—3毫米時,VST(視頻透視)跟OST(光學透視)的體積、厚度就沒有大的區(qū)別了。

03、MR眼鏡的重量是克克計較,不是斤斤計較

【主持人嚴鋒】我們看到一個主要的差異來了。在未來超透鏡的方案下,翁總認為VST(視頻透視)也能做到小型化、輕量化。祝總您有什么樣的回應?

【OST祝銘明】整個XR產(chǎn)業(yè)都是越輕越好。我相信VST(視頻透視)的方案也會越做越小,包括剛才講到的Metalens超透鏡方案。但是人體對眼鏡的忍受力有差異。當你24小時佩戴眼鏡時,你對重量是以克為單位來斤斤計較的,其實是克克計較,每一克都在計較。

說到底,當VST(視頻透視)和OST(光學透視)同時都接近普通眼鏡形態(tài)時,差距到底會是什么?比如說差10克、20克,那就是一個比較明顯的差距。經(jīng)過測試,人佩戴眼鏡的總體舒適區(qū)域大概是在60克左右,無論是亞洲人還是歐美人。

這就提出了一個比較大的挑戰(zhàn)。剛才翁總也講到了,光學是一個方面。比如說VST(視頻透視)要做重建,重建物理世界所帶來的成本和功耗、配重各方面,還是很難跟OST(光學透視)達到一個相同的水準。

我覺得VST(視頻透視)可能會做到一個類似接近眼鏡的形態(tài),但想做到普通眼鏡形態(tài),難度還是比較高的。OST(光學透視)也不容易,但是有機會,VST(視頻透視)可能會更難一些。在這個方面,我倒是覺得還是那句話,OST(光學透視)作為大眾老百姓的選擇會更容易一些。但對于專業(yè)人士來講,VST(視頻透視)是一個大家不會去舍棄的一個方向。

第二個是小型化帶來的一個問題。譬如VST(視頻透視)是不是要把整個眼睛包起來。如果不包起來,就會面臨你的眼睛能同時看到物理世界和通過VST(視頻透視)來看到的物理世界,這兩個世界的坐標很難對齊。但如果你想制造沉浸感,可能它很難做到普通眼鏡形態(tài),這就是我們所面臨的一個挑戰(zhàn)。而OST(光學透視)第一天起就沒有這個負擔。因為OST(光學透視)從第一天起就是裸眼直接看所有的物理世界。所以它可以將精力放在虛擬世界上。這意味著OST(光學透視)的整個硬件投入,算力成本,展示力都相對比較靈活。

【VST翁志彬】通過柔性顯示技術,VST(視頻透視)技術的FOV是可以接近于人眼的,對于用戶來說,VST(視頻透視)技術就能實現(xiàn)完全真實的視覺體驗,用戶沒有必要在MR眼鏡視野之外,去看這個世界,而未來采用VST(視頻透視)技術的MR眼鏡,他的遮光材料一定是超輕、超柔、超薄的,只會增加2-4克的重量,對實際的佩戴體驗沒有影響。

04、FOV對MR設備來說真的重要嗎?

【主持人嚴鋒】我們除了從未來時間的角度,從市場面向大眾還是小眾的角度來看,??偺岢鯫ST(光學透視)將來一定是面向大眾的,翁總您覺得是這樣嗎?是不是VST(視頻透視)也可以是面向大眾的?

【VST翁志彬】針對??偯枋龅奈磥恚乙灿胁煌目捶?。從OST(光學透視)來說,我們忽略了一點,我們只說了小型化這一塊,但是我們還有一個核心體驗。核心體驗就是沉浸感。

我相信OST(光學透視)現(xiàn)在最大的問題是FOV不夠大。因為從目前的光波導方案或者birdbath技術很難做突破,做到50度以上的FOV都挺難的。我認為沉浸感對MR設備屬于核心體驗。雖然在分辨率PPD上,我覺得這兩個路徑在一定程度上都能達標。Micro OLED顯示技術可能很快會解決PPD的問題。但是OST(光學透視)如何在保持90度或者100度以上的FOV,同時PPD也能達到40以上?

回到電視機時代,我小時候看電視有32寸的,現(xiàn)在再回過去讓你看40寸的電視機,就沒法看了。因為人本質是個視覺動物,視覺的沉浸感非常重要。VST(視頻透視)的FOV已經(jīng)在100度以上,我們馬上已經(jīng)能做150度了。那么OST(光學透視)能不能短時間把FOV加大?如果很難加大,在這種情況下,用戶體驗兩個產(chǎn)品,他會發(fā)現(xiàn)核心體驗差別這么大。此時,小型化就不是用戶的一個可考量點了。

早前手機時代有電競手機,結果這幾年電競手機消失了,是因為普通手機的處理器、散熱性能也已經(jīng)達到電競手機的標準了,而且普通手機很薄。這意味著當VST(視頻透視)這條路線我們能做到超薄、FOV加大、處理能力越來越強時,VST(視頻透視)和OST(光學透視)兩個產(chǎn)品看起來的形態(tài)差距就沒那么明顯了。

【OST祝銘明】我們要問的一個問題是OST(光學透視)真的需要那么大的FOV嗎?VST(視頻透視)一定是需要的,因為VST(視頻透視)對人、真實世界的感知是不能丟掉信息的,當然你是看得越全越好。但是大家要知道OST(光學透視)其實對于真實世界,天然是不丟失信息的。而我們真正對數(shù)字世界信息的處理,本身人類有效的FOV也就這么多。所以FOV這個核心體驗對于VR和MR或者VST(視頻透視)的人來講是非常重要的,反而在OST(光學透視)里是一個可選的東西。

當然我們做通用計算平臺,在使用不同東西時,對FOV也是有高低要求的。比如我在看電影時,F(xiàn)OV也不能太大。大家如果坐過電影院的第一排、第二排就知道FOV太大反而不舒服。而當我用OST(光學透視)做導航或者做信息提示的時候,對FOV的要求就更小。這也是現(xiàn)在很多AR產(chǎn)品的一個核心發(fā)展路徑:做小FOV,但我也把能力局限在簡單的信息提醒上。所以我覺得,當然OST(光學透視)的FOV是越大越好,但并不是說非得大到像VST(視頻透視)那么大,兩個技術路線各自所追求的東西不一致。

大家都知道大部分情況下,人對信息的感知就是你眼睛所前視的那么幾十度的FOV。如果拋掉人的視覺掃描,大腦和補全的畫面來講,真正清晰的FOV就是你把手伸直,把大拇指伸起來,你的眼睛、你的鼻梁跟大拇指形成的夾角的度數(shù)。我們看電影大概是一個40、50度到60度的FOV,這就已經(jīng)夠大了,再大就看不過來了。我們今天的Rokid產(chǎn)品已經(jīng)在50度了。因為50度看的時候你已經(jīng)會覺得太大,所以我們今天還反而做了一個最新的版本,還做了一個把畫面縮小的動作。所以,到底在OST(光學透視)路徑下,F(xiàn)OV是不是核心體驗,我覺得是一個問號。

【主持人嚴鋒】翁總的理解,這個核心體驗,是由FOV、沉浸感、分辨率這些東西構成。??偟恼f法也非常有意思,他說其實這個核心體驗跟不同的技術路線有關,所以不同的技術路線對核心體驗的理解,或者說要求也不一樣。那么在VR里面,F(xiàn)OV就是非常剛需了,那如果是AR的話,可能它還自帶FOV,有天然的FOV。我的理解是在目前情況下,它確實就是一種妥協(xié),就是說你是要輕便還是要市場大小,在目前很難兩全的情況下,我們怎樣根據(jù)自己的要求,無論是用戶還是場景,能夠有一個取舍,那么這也涉及到對MR的一個理解。

05、VSTVSOST快問快答環(huán)節(jié)

【主持人嚴鋒】下面進入快問快答環(huán)節(jié)。

問題一:隨著技術的發(fā)展,VR將主要用于娛樂和游戲,而AR將主要用于實用應用和工作。您認為“是”還是“否”?

【OST祝銘明】我覺得這個問題是做VR的人不認可,做AR的人也不認可。因為大家其實最終都想解決所有的問題。所以現(xiàn)在不要去下定論,說什么東西更適合娛樂,什么東西更適合生產(chǎn)。比如說Vision Pro和Quest3,也是比較明確地想往生產(chǎn)力方面去發(fā)展。反而是我們今天賣的AR產(chǎn)品反而偏娛樂多一點,玩游戲看電影的人多一些。最終大家都希望MR技術能夠變成一個通用計算平臺,既占領娛樂和生產(chǎn)力,甚至利用大家的碎片時間,如果真的能做到輕量化24小時佩戴的話。我相信小派也一樣不甘心說只做娛樂。

大家還是希望MR能成為一個通用的計算平臺,這是我們大家一起努力的方向,這才值得期待。

問題二:你認為AR和VR未來會融合成同一個產(chǎn)品嗎?

【主持人嚴鋒】??傉J為AR和VR將來都會成為一個通用的平臺。這其實也是我們的第二個問題:你認為AR和VR未來會融合成同一個產(chǎn)品嗎?翁總,你覺得呢?

【VST翁志彬】我認為會成為同一個產(chǎn)品。那時候可能就到了我們這個行業(yè)的下半場,AR的概念和VR的概念可能慢慢地消失。就像早年的手機有翻蓋機、功能機、折疊機等等,但等到最終智能機出現(xiàn)后,那些手機就消失了。

所以,一旦MR的概念推起來,就像剛才??偺岬降?,當MR作為一個通用計算平臺慢慢開始流行起來的話,那慢慢地大家就覺得AR和VR已經(jīng)是過去式了。我認為MR可能是未來融合的一個形態(tài)。而且在未來很長一段時間,我們都會以這個概念去影響市場和技術。

結論環(huán)節(jié)

【主持人嚴鋒】:兩位嘉賓對MR設備透視功能的兩種技術路線,以及發(fā)展前景都進行了非常精彩的描述。

我的理解是,互聯(lián)網(wǎng)和人機界面都要往前走,手機和電腦都要更新?lián)Q代,我們需要更人性化的操作系統(tǒng)。所以空間計算和MR都代表未來的一個趨勢。

但具體這個路怎么走?可以有不同的路徑,它也可以有一個發(fā)展的過程。

在我們討論當中,兩位嘉賓都相信虛擬和現(xiàn)實一定會越來越聯(lián)接和融合,這兩者是缺一不可,但是可以有不同的聯(lián)接和融合方式。

AR方向的MR是在現(xiàn)實當中看見虛擬,這是OST(光學透視)擅長的路線,VR方向的MR是在虛擬中看見現(xiàn)實,沉浸感更強。我們相信在未來這兩條路線也會越走越近,甚至合二為一。

我們這一期的創(chuàng)投變辯辨就到這里,謝謝兩位嘉賓,讓我們下期再見!

(導演:獅刀 編輯:騰訊科技 周小燕)

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )