&

【每日科技網】

　　一篇論文，一篇論文候選，共計54篇論文被接收，商湯科技及聯(lián)合實驗室交出CVPR 2023閃亮的成績單。

　　6月18日-22日，全球計算機視覺盛會CVPR 2023(Computer Vision and Pattern Recognition)在加拿大溫哥華舉行。本屆CVPR論文投稿總量達9155篇，最終共有2369篇論文被接收。論文候選為12篇，接收率僅為0.13%。

　　商湯兩篇論文登上論文候選名單(Award Candidate)，其中自動駕駛研究論文《Planning-oriented Autonomous Driving》(以路徑規(guī)劃為導向的自動駕駛)斬獲本屆CVPR論文獎(Best Paper Award)。

　　這是CVPR歷史上第一篇以自動駕駛為主題的論文，該論文提出感知決策一體化的自動駕駛通用大模型UniAD，開創(chuàng)了以全局任務為目標的自動駕駛大模型架構先河, 標志著自動駕駛技術的重要突破, 為自動駕駛技術與產業(yè)的發(fā)展提出了新的方向。

　　CVPR 2023論文，自動駕駛研究獲重要突破

　　自動駕駛技術高度復雜，需要融合多學科領域的知識和技能，包括傳感器技術、機器學習、路徑規(guī)劃等方面。自動駕駛還需要適應不同的道路規(guī)則和交通文化，與車輛和行人進行良好交互，以實現(xiàn)高度可靠和安全的自動駕駛系統(tǒng)。大部分自動駕駛相關的工作都聚焦在具體的某個模塊，缺少能夠實現(xiàn)端到端聯(lián)合優(yōu)化的通用網絡模型。

　　論文提出的自動駕駛通用算法框架——Unified Autonomous Driving(UniAD)將檢測、跟蹤、建圖、軌跡預測，占據柵格預測以及規(guī)劃整合到一個基于Transformer 的端到端網絡框架下，更高效契合了“多任務”和“高性能”的特點，取得自動駕駛技術研究重要突破。

自動駕駛UniAD框架對比(a)模塊化(b)多任務模塊(c)端到端自動駕駛模塊　　商湯科技聯(lián)合創(chuàng)始人、首席科學家、絕影智能汽車事業(yè)群總裁王曉剛表示，UniAD是業(yè)內感知決策一體化的端到端自動駕駛解決方案，并且整體系統(tǒng)和性能取得大幅提升，代表了未來自動駕駛技術的發(fā)展趨勢。

　　這種端到端的優(yōu)化在多項關鍵技術指標上超越了SOTA。比如，多目標跟蹤準確率超越SOTA 20%，車道線預測準確率提升30%，預測運動位移誤差降低38%，規(guī)劃誤差降低28%。

　　UniAD 是一項極具創(chuàng)新性的自動駕駛技術，且因其具有很大的潛力和應用價值，目前在學術界和工業(yè)界都引起了廣泛興趣和關注。

　　隨著通用人工智能(AGI)引領的二次革命的到來，以此為基礎，期待在未來能推動實現(xiàn)更高階的自動駕駛人工智能。

　　CVPR 2023論文候選，加速推動AIGC時代真實感3D內容生成

　　面向真實 3D 物體的感知、理解、重建與生成是計算機視覺領域一直倍受關注的問題。由于缺乏大規(guī)模的真實掃描三維數(shù)據庫，最近在三維物體建模方面的進展大多依賴于合成數(shù)據集。

　　為促進現(xiàn)實世界中3D感知、重建和生成的發(fā)展，論文《OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation》提出了OmniObject3D，一個具有大規(guī)模高質量真實掃描3D物體的大型詞匯3D物體數(shù)據集，覆蓋近200個類別、約6000個三維物體數(shù)據，包括高精表面網格、點云、多視角渲染圖像和實景采集的視頻，借助專業(yè)掃描設備保證了物體數(shù)據的精細形狀和真實紋理。

　　OmniObject3D是目前學界的真實世界三維掃描模型數(shù)據集，為未來三維視覺研究提供了廣闊空間。

　　利用該數(shù)據集，研究人員精心探討了點云識別、神經渲染、表面重建、三維生成等多種學術任務的魯棒性和泛化性，驗證其從感知、重建、到生成領域的開放應用前景，有望在AIGC 時代推動真實感3D生成方面發(fā)揮至關重要的作用。持續(xù)引領前沿創(chuàng)新，是商湯在以大裝置SenseCore和大模型為核心的AI基礎設施領域長期投入，并堅持產學研協(xié)同創(chuàng)新的成果。

　　王曉剛教授認為，在大算力、大數(shù)據的支撐下，大模型將以更強大的通用能力引發(fā)人工智能領域的巨大變革，同時也會拓展我們的研究視野，激發(fā)新一輪研究范式革新。

　　自今年4月初“商湯日日新SenseNova”大模型體系公布以來，商湯的大模型已在氣象預報、遙感解譯、開放環(huán)境中的決策問題等領域取得了諸多突破性成就。未來，商湯將繼續(xù)與產學研各界共同擁抱和探索大模型帶來的范式革新，為AI的前沿探索開拓新方向和新路徑。