記者 王閑樂
隨著自動(dòng)駕駛、chatgpt等名詞在互聯(lián)網(wǎng)傳播,越來越多人知道了人工智能技術(shù)。那么,你知道發(fā)展人工智能技術(shù)也需要“原材料”嗎?
啟數(shù)光輪科技(上海)有限公司就是這樣一家生產(chǎn)人工智能所需要的“原材料”——數(shù)據(jù)的公司。
“現(xiàn)在人工智能大模型迅速發(fā)展,對數(shù)據(jù)的需求特別大,整個(gè)互聯(lián)網(wǎng)的數(shù)據(jù)加一起都不夠用了。”啟數(shù)光輪創(chuàng)始人謝晨說,這時(shí)候就需要通過合成數(shù)據(jù)來推動(dòng)人工智能發(fā)展。他之所以從蔚來汽車辭職創(chuàng)業(yè),正是看到了這一領(lǐng)域的廣闊前景。
為人工智能提供海量數(shù)據(jù)
謝晨曾在英偉達(dá)、cruise、蔚來等企業(yè)擔(dān)任自動(dòng)駕駛仿真負(fù)責(zé)人。在英偉達(dá)工作期間,謝晨發(fā)現(xiàn),要讓自動(dòng)駕駛變得更安全,需要大量的訓(xùn)練數(shù)據(jù)。如果完全依賴于現(xiàn)實(shí)世界中的數(shù)據(jù),不僅難以采集,而且存在利用率低、標(biāo)注成本高和長尾場景缺乏等問題。于是,他萌生了一個(gè)大膽的想法——能不能人工合成出這些訓(xùn)練數(shù)據(jù)?
“比較通俗的類比是,人工智能就像我們養(yǎng)殖的動(dòng)物,需要吃飼料才能長大??墒菃慰孔匀唤缰械娘暳鲜遣粔虻?,所以我們得想辦法去自己生產(chǎn)一些飼料。”謝晨說,他想到的辦法是將生成式人工智能(aigc)與仿真技術(shù)深度融合。
仿真技術(shù)本身并不罕見,但單靠仿真技術(shù)生成的數(shù)據(jù)真實(shí)度、泛化性與效率較低,通俗來講就是“不夠真實(shí)”,因此無法解決現(xiàn)有難點(diǎn),還需探索如何與生成式人工智能相結(jié)合。謝晨結(jié)合自己負(fù)責(zé)的自動(dòng)駕駛業(yè)務(wù),開始驗(yàn)證兩種技術(shù)融合的可能性。
經(jīng)過反復(fù)驗(yàn)證,謝晨用了5年時(shí)間,終于摸索出了生成式人工智能與仿真技術(shù)最佳融合方法,由此可以生成映射現(xiàn)實(shí)世界的合成數(shù)據(jù)——圖像或視頻,通過訓(xùn)練算法理解和學(xué)習(xí)現(xiàn)有數(shù)據(jù)便可生成3d、物理真實(shí)、可泛化的新數(shù)據(jù)。
幫助中國企業(yè)追趕特斯拉
2023年,帶著自己的研究成果,謝晨毅然決定從蔚來汽車辭職創(chuàng)業(yè)。
“我們希望,通過合成數(shù)據(jù)的應(yīng)用,助力中國汽車企業(yè)在自動(dòng)駕駛技術(shù)上縮小與特斯拉的差距,甚至實(shí)現(xiàn)超越。”謝晨解釋道,特斯拉現(xiàn)在在全球擁有上百萬輛汽車,它們源源不斷地傳回?cái)?shù)據(jù)、幫助人工智能不斷優(yōu)化。而中國車企掌握的數(shù)據(jù)可能只有特斯拉的百分之一,長此以往,雙方的人工智能差距也會(huì)拉大。
“啟數(shù)光輪可以提供海量合成數(shù)據(jù),相當(dāng)于加了一個(gè)杠桿,來填補(bǔ)中國車企在真實(shí)數(shù)據(jù)量上與特斯拉的差異。”謝晨說,啟數(shù)光輪成立后完成的第一單業(yè)務(wù),就很好地證明了合成數(shù)據(jù)的價(jià)值。
在業(yè)務(wù)拓展過程中,有汽車廠商告訴謝晨,企業(yè)正在研制的自動(dòng)駕駛有個(gè)問題始終難以解決,就是會(huì)將路邊廣告牌的人物圖案識(shí)別為真人進(jìn)而啟動(dòng)剎車。如果修改識(shí)別規(guī)則,又無法鑒別真正的行人,容易造成交通事故。
“其實(shí)這里的問題就在于企業(yè)缺乏足夠多的路況數(shù)據(jù)。”謝晨的團(tuán)隊(duì)拿下這一單,生成了數(shù)千個(gè)包含人像廣告的各類場景,并從中挑選出帶有精確標(biāo)注的數(shù)據(jù)。這些數(shù)據(jù)隨后被該車企用于算法訓(xùn)練,果然有效增強(qiáng)了自動(dòng)駕駛模型的表現(xiàn)。
由此,啟數(shù)光輪在業(yè)界嶄露頭角,作為一家初創(chuàng)企業(yè)在業(yè)內(nèi)迅速打響了名氣。成立一年多,就獲得了四輪融資,得到了多家頭部創(chuàng)投機(jī)構(gòu)的認(rèn)可。
推動(dòng)人工智能相關(guān)產(chǎn)業(yè)發(fā)展
從在大企業(yè)做創(chuàng)新研發(fā),到自主創(chuàng)業(yè),謝晨坦言,這一年多的經(jīng)歷給了他很大挑戰(zhàn),也讓他感到十分興奮。
從一開始,他就給自己的新公司定了一個(gè)長遠(yuǎn)的目標(biāo):成為數(shù)據(jù)界的英偉達(dá)。對此,謝晨很有信心。“我們有一個(gè)很棒的團(tuán)隊(duì),平均年齡28歲,來自合成數(shù)據(jù)、生成式人工智能、仿真等領(lǐng)域的優(yōu)秀技術(shù)人員占比超過90%,還有商業(yè)領(lǐng)域的人才。”
目前,啟數(shù)光輪在謝晨的主導(dǎo)下搭建了國際領(lǐng)先的合成數(shù)據(jù)產(chǎn)線,擁有多項(xiàng)國內(nèi)外技術(shù)專利,為多家海內(nèi)外知名自動(dòng)駕駛公司、國內(nèi)外主機(jī)廠提供產(chǎn)品交付并形成合作伙伴關(guān)系,累計(jì)服務(wù)客戶幾十余家,交付數(shù)據(jù)上億幀,積累場景數(shù)百萬個(gè)。
“使用合成數(shù)據(jù)訓(xùn)練人工智能已經(jīng)是硅谷的共識(shí),但國內(nèi)對這塊認(rèn)識(shí)還不夠。”謝晨希望,通過啟數(shù)光輪的一系列成功案例,讓更多人意識(shí)到合成數(shù)據(jù)的價(jià)值,推動(dòng)自動(dòng)駕駛、具身智能等相關(guān)產(chǎn)業(yè)蓬勃發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.