近日,AI基礎架構與數(shù)據(jù)智能平臺服務商曼孚科技宣布,已于2023年9月完成數(shù)千萬元B輪融資,本輪投資方為安樸資本。所融資金將主要用于AI基礎設施搭建、大模型標注平臺閉環(huán)更迭以及數(shù)據(jù)標注市場拓展等。
曼孚科技商業(yè)化始于2019年,是一家數(shù)據(jù)驅動的AI基礎設施平臺企業(yè),致力于從數(shù)據(jù)中獲取洞見與價值,并以更精簡方式構建人工智能應用,實現(xiàn)AI的輕量化與普惠化。
旗下主要產品服務包括:面向數(shù)據(jù)生命周期管理的數(shù)據(jù)智能平臺、AI數(shù)據(jù)中臺、AutoLabeling平臺、AutoML平臺以及基礎數(shù)據(jù)服務(數(shù)據(jù)標注、數(shù)據(jù)采集、數(shù)據(jù)清洗)等。
憑借從戰(zhàn)略到技術落地的一站式數(shù)據(jù)解決方案,目前已與數(shù)百家企業(yè)達成深度合作,業(yè)務場景涵蓋自動駕駛數(shù)據(jù)標注、AI數(shù)據(jù)生命周期管理等。用戶包括主機廠、造車新勢力、一線科技公司、主流算法公司以及世界頂級Tier1廠商等,2023年營收額預估將實現(xiàn)3倍以上持續(xù)性增長。
數(shù)據(jù)定義模型
AI產業(yè)歷經多年發(fā)展,已逐漸步入技術與商業(yè)的交叉點。
算法模型從關注增量的建模改進,轉變?yōu)閺娬{性能的迭代與優(yōu)化,以契合商業(yè)應用場景對模型質量更為苛刻的要求。
結構化數(shù)據(jù)已成為AI算法模型開發(fā)與迭代的基礎。AI強大“理解力”的造就,離不開結構化數(shù)據(jù)源源不斷的輸入,和對數(shù)據(jù)更為精細化的運用。
AI行業(yè)正圍繞以數(shù)據(jù)為中心進行整合,誰擁有數(shù)據(jù),誰就擁有模型的定義權。
在細分場景,自動駕駛城市NOA熱潮興起。技術范式全面革新下,自動駕駛感知算法向BEV+Transformer架構升級,端到端算法解決方案成為主流,推動自動駕駛感知算法從輕量的CNN二維感知,到基于Transformer四維感知的升維,也催生了數(shù)據(jù)需求的指數(shù)型增加。
自動駕駛在AI大模型的助力下迎來臨界點。但量變到質變的前置條件是大規(guī)模數(shù)據(jù)的支持——Transformer大模型質變需要數(shù)億公里標注數(shù)據(jù)的投喂,并覆蓋不斷出現(xiàn)的Corner Case,這對數(shù)據(jù)量產規(guī)模以及自動化水平提出了更高的要求。
自動駕駛的終極目標是完成對駕駛員的取代,但在此之前,數(shù)據(jù)標注員需要率先被神經網絡所取代。
AI驅動的數(shù)據(jù)智能平臺
隨著BEV+Transformer技術路線成為新一代自動駕駛感知能力的核心架構,數(shù)據(jù)閉環(huán)能力取代算法范式,成為決定商業(yè)量產從1到N的勝負關鍵。
而數(shù)據(jù)閉環(huán)的每一步推進都是成本與效率的博弈,低成本AI數(shù)據(jù)量產能力又成為助推數(shù)據(jù)飛輪的關鍵。
作為行業(yè)領先的AI基礎架構與數(shù)據(jù)智能平臺服務商,曼孚科技以產品技術為核心驅動力,通過構建AI+RPA驅動的數(shù)據(jù)平臺沉淀數(shù)據(jù)Know-How能力,在業(yè)內率先實現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)?;慨a。
曼孚科技數(shù)據(jù)平臺核心產品體系由MindFlow SEED數(shù)據(jù)服務平臺與MindFlow AutoLabeling自動標注平臺構成,歷經多代版本更迭,現(xiàn)已在3D、4D點云數(shù)據(jù)處理領域,建立起6-12個月的技術壁壘。
具體應用場景上,平臺支持自動駕駛等場景下2D、3D、4D全類別標注,如2/3D融合、點云分割、點云時序疊幀、BEV標注等。
針對4D點云標注場景下大規(guī)模點云適配渲染問題,曼孚科技自研地圖分片與LOD大規(guī)模點云渲染技術,4D點云車道線與4D點云分割場景均可實現(xiàn)低配置單幀數(shù)億級點云平穩(wěn)運行。
4D點云分割標注場景
作為自動化AI數(shù)據(jù)平臺,RPA與AI能力的建設是曼孚科技構建技術壁壘的核心。
RPA能力主要體現(xiàn)在流程自動化以及調度分發(fā)自動化等多個方面。而AI能力則已深入數(shù)據(jù)流轉各環(huán)節(jié),具體體現(xiàn)在:
1)覆蓋數(shù)據(jù)預處理、算法推斷至結果精修完整算法鏈路,已商用靜態(tài)道路自適應分割、動態(tài)障礙物AI預處理、AI交互式標注等數(shù)十種AI算法標注模型;
2)采用Backbone+多Head算法架構,快速適配不同場景,大幅降低多任務模型研發(fā)成本;
3)基于AutoML以及自有數(shù)據(jù)集構建AI標注模型,自我驅動完成算法迭代;
4)運用遷移學習、知識蒸餾等方式,基于小批量數(shù)據(jù)+底層通用大模型快速產出算法模型。
RPA與AI能力的強耦合,賦予曼孚科技以更低人力支出與邊際成本,提供更具標準化數(shù)據(jù)解決方案的能力。綜合人效平均提升80%,數(shù)據(jù)生產成本平均降低50%,并實現(xiàn)AI數(shù)據(jù)低成本、無上限、規(guī)模化量產。
基于大模型的AI自動標注體系
作為引領人工智能新一輪躍遷式發(fā)展的全新底座,大模型正走深向實,賦能千行百業(yè)。
海量參數(shù)帶來的容量優(yōu)勢,賦予大模型更強的性能與泛化能力,為數(shù)據(jù)預處理、數(shù)據(jù)標注等傳統(tǒng)依賴人力的環(huán)節(jié),提供了全新的技術解決范式。
目前,曼孚科技已完成自動駕駛數(shù)據(jù)標注視覺大模型研發(fā)。通過引入駕駛數(shù)據(jù)建立RLHF,并基于深度學習與計算機視覺構建大模型,可實現(xiàn)復雜駕駛場景下,數(shù)據(jù)的高效處理與全自動化標注。
曼孚科技數(shù)據(jù)標注大模型的主要技術特點如下:
1)基于弱監(jiān)督與半監(jiān)督學習,通過少量人工標注數(shù)據(jù)與大量無標注數(shù)據(jù),實現(xiàn)對場景物體的高效檢測、分割與識別;
2)基于BEV多視角融合與三維重建,借助多攝像頭、激光雷達等來源數(shù)據(jù),自動生成場景物體三維信息;
3)運用遷移學習方式,對不同場景與不同模態(tài)下的數(shù)據(jù),進行統(tǒng)一表示與學習,提升模型泛化能力與適應性;
4)運用主動學習與交互式學習方式,通過與人工標注過程進行反饋,不斷優(yōu)化迭代模型性能。
上述大模型技術加持下,典型自動駕駛數(shù)據(jù)標注場景平均效率可提升4-5倍以上,引領曼孚科技率先步入自動化數(shù)據(jù)標注時代。
數(shù)據(jù)驅動的AI基礎設施
算法更新迭代的全生命周期內,從設計、訓練、評測到仿真等環(huán)節(jié)均需要海量數(shù)據(jù)不斷輸入作為支撐,其中數(shù)據(jù)標簽是整個流程的基礎與起點。
如果說互聯(lián)網時代是對信息流量的搬運,那么人工智能尤其是大模型時代,則是對海量數(shù)據(jù)的搬運與精細化運用。
在信息流量的基礎上,誕生了諸多影響深遠的商業(yè)模式。AI時代,任何人也均可使用數(shù)據(jù)作為“鏟子”去探索商業(yè)“金礦”。是否擁有質量更高、數(shù)量更多的“鏟子”,是決定“淘金人”能否真正掌握主動權,淘到金子的關鍵。
AI大淘金時代,曼孚科技希望扮演起為“淘金人”服務的角色,以數(shù)據(jù)為驅動力向AI上下游延伸,打造起通用AI基礎設施。用戶可以以更精簡方式構建AI應用并管理全生命周期,同時也可以更加靈活調整模型構建流程中的每個組件,以得到更契合的需求與分析結果。
在上述愿景指引下,曼孚科技目前已在自動駕駛場景構建起AI數(shù)據(jù)閉環(huán)平臺,涵蓋DaaS數(shù)據(jù)標注平臺、數(shù)據(jù)管理平臺、AutoLabeling平臺以及AutoML平臺等,提供從數(shù)據(jù)準備到模型應用的端到端解決方案,并延伸至其他AI應用場景。
其中,數(shù)據(jù)管理平臺集數(shù)據(jù)存儲、處理、導入導出于一體,通過SDK打通數(shù)據(jù)采集平臺、數(shù)據(jù)標注平臺、模型訓練平臺與生產運營系統(tǒng)等外部平臺,借助AI與大數(shù)據(jù)技術加強智能標簽、分析報表、場景挖掘與自然語言搜索等功能體驗,提高數(shù)據(jù)使用與管理效率。
而AutoML平臺則是面向自動駕駛等通用視覺場景的自動訓練平臺,提供算法模型自動訓練與快速迭代功能??勺詣觾?yōu)化模型結構、參數(shù)與超參數(shù),提升性能與泛化能力,實現(xiàn)零代碼一鍵訓練,無人值守。
曼孚科技AI基礎設施架構
曼孚科技AI基礎設施解決方案全面覆蓋數(shù)據(jù)層至算法層,既可提供DaaS服務,也可提供MaaS服務。無論用戶規(guī)模大小、是否具備AI研發(fā)能力,只要存在AI需求,即可使用曼孚科技提供的基礎設施,輕松創(chuàng)建專屬AI產品,實現(xiàn)從數(shù)據(jù)到商業(yè)價值的轉變。
AI For Everyone
獨立自研的數(shù)據(jù)閉環(huán)平臺、AI數(shù)據(jù)量產能力以及對客戶業(yè)務需求的敏銳洞察,讓曼孚科技在不斷變化的市場中實現(xiàn)業(yè)務超預期增長,數(shù)據(jù)驅動的AI基礎設施在自動駕駛等行業(yè)驗證了應用價值與商業(yè)潛力。
下階段,曼孚科技將繼續(xù)深耕數(shù)據(jù)行業(yè),不斷完善AI基礎設施建設。正如AWS之于云計算,Snowflake之于數(shù)據(jù)分析一樣,曼孚科技希望在AI行業(yè)能以數(shù)據(jù)構建起通用基礎設施,幫助用戶以更精簡方式訓練與部署人工智能應用。無論是初創(chuàng)企業(yè)、成熟公司亦或是個人,均可通過簡單點擊或幾行代碼享受AI帶來的便利,實現(xiàn)真正的AI民主化與普惠化。
互聯(lián)網時代,谷歌憑借搜索引擎掌控了互聯(lián)網流量入口,微軟憑借操作系統(tǒng)掌控了PC生態(tài)鏈的上游,目前尚未出現(xiàn)挑戰(zhàn)谷歌、微軟等萬億體量的科技新貴,但AI正讓一切變得可能。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )