AI訓(xùn)練數(shù)據(jù)服務(wù)商海天瑞聲(688787)日前舉辦2025年半年度業(yè)績說明會(huì),公司高管回應(yīng)了上半年毛利率下降的原因,同時(shí)公司積極布局海外數(shù)據(jù)標(biāo)注市場,以及具身智能模型訓(xùn)練數(shù)據(jù)需求。
定制化服務(wù)收入拖累毛利率
受益于計(jì)算機(jī)視覺、自然語言和智能語音三大業(yè)務(wù)板塊全面增長,今年上半年海天瑞聲實(shí)現(xiàn)營業(yè)收入1.57億元,同比增長近七成,歸母凈利潤380萬元,同比增長約8倍。但報(bào)告期內(nèi)公司銷售毛利率為50.17%,環(huán)比進(jìn)一步下降。
對于毛利率下滑的原因,海天瑞聲高管表示,主要系受業(yè)務(wù)類型階段性變化影響,定制化服務(wù)收入占比提升所致。公司新拓展的境外內(nèi)容審核業(yè)務(wù)目前全部采用定制化服務(wù)模式,另外,央企客戶正積極踐行“AI+”戰(zhàn)略,其行業(yè)數(shù)據(jù)需求具有高度差異化特征,因此相關(guān)業(yè)務(wù)也以定制類服務(wù)為主。
據(jù)介紹,在國家“AI+數(shù)據(jù)要素”戰(zhàn)略的指引下,重點(diǎn)央企自2024年起加速布局通用+垂向大模型研發(fā),帶動(dòng)了高質(zhì)量圖像、視頻等訓(xùn)練數(shù)據(jù)的規(guī)?;少徯枨?。公司已成為中國移動(dòng)重要的數(shù)據(jù)服務(wù)供應(yīng)商。
展望未來,公司將在持續(xù)深耕頭部客戶需求的基礎(chǔ)上,加快推進(jìn)標(biāo)注流程的智能化升級與標(biāo)準(zhǔn)化數(shù)據(jù)產(chǎn)品體系建設(shè),不斷提升項(xiàng)目運(yùn)營效率,逐步優(yōu)化毛利結(jié)構(gòu)。
拓展海外市場
“海外市場空間廣闊,規(guī)模為國內(nèi)多倍,且隨著Meta收購Scale AI,Google、微軟等多家大廠開始切斷與Scale AI的合作,海外AI數(shù)據(jù)服務(wù)市場格局正在重塑,這為專業(yè)數(shù)據(jù)服務(wù)商帶來了新的市場機(jī)遇?!?海天瑞聲董事長賀琳表示。
目前公司全面推進(jìn)全球化戰(zhàn)略布局,一方面通過并購菲律賓交付基地構(gòu)建海外標(biāo)注產(chǎn)能,重點(diǎn)拓展更具市場潛力的定制化服務(wù);另一方面加快全球化服務(wù)網(wǎng)絡(luò)建設(shè),已在中國香港、新加坡和美國設(shè)立區(qū)域子公司,并積極推進(jìn)日本、韓國及歐盟子公司落地,提升客戶觸達(dá)效率和需求響應(yīng)速度。
從收入結(jié)構(gòu)來看,海天瑞聲計(jì)算機(jī)視覺和自然語言業(yè)務(wù)占比提升,分別為40%、14%,主要得益于相關(guān)領(lǐng)域的技術(shù)突破和市場需求增長。其中,在計(jì)算機(jī)視覺領(lǐng)域,受益于視覺大模型技術(shù)的快速迭代和應(yīng)用場景的持續(xù)拓展,特別是圖像與視頻文本對等數(shù)據(jù)需求的爆發(fā)式增長,該業(yè)務(wù)板塊實(shí)現(xiàn)強(qiáng)勁增長。同時(shí),公司在東南亞的數(shù)據(jù)交付體系已穩(wěn)定運(yùn)營,進(jìn)一步帶動(dòng)了視覺業(yè)務(wù)收入的提升。
在自然語言處理方面,大模型技術(shù)在政務(wù)、法律合規(guī)等專業(yè)領(lǐng)域的深度應(yīng)用成效顯著,疊加全球化擴(kuò)張帶來的多語言語料需求激增,共同推動(dòng)了該業(yè)務(wù)的快速發(fā)展。相較而言,智能語音業(yè)務(wù)雖保持穩(wěn)定增長,但增速相對平緩。因此,計(jì)算機(jī)視覺和自然語言處理這兩大高增長業(yè)務(wù)在整體收入結(jié)構(gòu)中的占比提升。
布局具身智能
海天瑞聲也在布局具身智能市場,旨在提供核心數(shù)據(jù)支撐。
賀琳表示,2025年具身智能進(jìn)入加速發(fā)展期,產(chǎn)業(yè)正從技術(shù)驗(yàn)證邁向場景應(yīng)用,這對訓(xùn)練數(shù)據(jù)的質(zhì)量、規(guī)模和場景化提出了更高要求。
據(jù)介紹,目前具身智能行業(yè)數(shù)據(jù)來源包括互聯(lián)網(wǎng)開源數(shù)據(jù)集(整合現(xiàn)有的公開機(jī)器人數(shù)據(jù))、虛擬合成(利用仿真環(huán)境生成訓(xùn)練數(shù)據(jù))、動(dòng)作捕捉(記錄人類在特定環(huán)境中的行為模式),以及機(jī)器人遙操(通過人工遠(yuǎn)程操控獲取真實(shí)場景下的操作數(shù)據(jù))等。其中,虛擬合成技術(shù)雖解決了初期數(shù)據(jù)短缺問題,但由于“仿真差距”的存在,其數(shù)據(jù)質(zhì)量往往難以滿足高精度訓(xùn)練需求。而開源數(shù)據(jù)集則面臨著數(shù)據(jù)規(guī)模有限(通常僅百萬級)、采集條件單一等挑戰(zhàn),無法支撐復(fù)雜場景下的模型訓(xùn)練需求。
具身智能行業(yè)正積極探索虛實(shí)結(jié)合的數(shù)據(jù)閉環(huán)模式,通過真實(shí)遙操數(shù)據(jù)修正仿真偏差,同時(shí)結(jié)合多模態(tài)標(biāo)注,持續(xù)提升數(shù)據(jù)的多樣性與有效性。在此背景下,海天瑞聲能夠?yàn)榫呱碇悄苣P陀?xùn)練提供支持,公司還攜手石景山人形機(jī)器人數(shù)據(jù)訓(xùn)練中心共建“具身智能數(shù)據(jù)訓(xùn)練場”,致力于打造“數(shù)據(jù)采集—模型訓(xùn)練—場景驗(yàn)證”的全流程閉環(huán),以解決行業(yè)數(shù)據(jù)瓶頸問題。此外,公司還發(fā)布了全國首個(gè)具身智能數(shù)據(jù)工程化服務(wù)平臺(tái),通過系統(tǒng)化、自動(dòng)化的數(shù)據(jù)管理賦能開發(fā)者,提升研發(fā)效率。
另外,圍繞數(shù)據(jù)要素業(yè)務(wù),海天瑞聲發(fā)揮生態(tài)優(yōu)勢,助力地方及產(chǎn)業(yè)園區(qū)打造數(shù)據(jù)標(biāo)注基地和構(gòu)建數(shù)據(jù)標(biāo)注產(chǎn)業(yè)新生態(tài)。目前公司已與3個(gè)承擔(dān)數(shù)據(jù)標(biāo)注基地建設(shè)任務(wù)的城市——成都、長沙、保定等地方政府成立合資公司,并與內(nèi)蒙古呼和浩特簽署戰(zhàn)略合作協(xié)議,聚焦當(dāng)?shù)厝闃I(yè)、草種、文旅等特色產(chǎn)業(yè),共建高質(zhì)量數(shù)據(jù)集,有效驅(qū)動(dòng)當(dāng)?shù)禺a(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。此外,公司正拓展與上海、廣州、宜賓等十余地的戰(zhàn)略合作,進(jìn)一步完善標(biāo)注基地的全國性業(yè)務(wù)布局。