一级毛片福利影院_国产一区二区三区高清av_亚洲网友拍到精美视频_黄色网站在线看精品

首頁 > 科技資訊 > 正文

標貝科技基于大模型能力的智能化標注 助力數(shù)據(jù)標注效率數(shù)倍提升

        【每日科技網(wǎng)】

  在ChatGPT掀起人工智能熱潮的當下,數(shù)據(jù)標注作為支持機器學習和人工智能發(fā)展的關(guān)鍵環(huán)節(jié)之一也成為了熱門話題。

  一方面,人工智能的興起帶來模型訓練所用結(jié)構(gòu)化數(shù)據(jù)的巨大需求,數(shù)據(jù)標注的重要性逐漸突顯。另一方面,人工智能在數(shù)據(jù)標注領(lǐng)域所取得的突破性進展,也推動數(shù)據(jù)標注行業(yè)從勞動密集型向技術(shù)驅(qū)動轉(zhuǎn)型,AI輔助標注、自動標注備受關(guān)注。

  傳統(tǒng)的數(shù)據(jù)標注主要依靠標注員手動標注,輸出的數(shù)據(jù)結(jié)構(gòu)和信息量簡單,無法處理高維數(shù)據(jù),效率低周期長,標注成本也高。而以ChatGPT為代表的預訓練大模型不僅可以對數(shù)據(jù)進行自動化標注,節(jié)省時間和人力成本。同時利用先進算法技術(shù)支撐,還能盡可能地保證標注的準確率,特別是對于復雜和大規(guī)模的數(shù)據(jù)集。

  標貝科技 基于大模型 能力 的AI自動標注

  面向大模型發(fā)展的時代趨勢,長期致力于為企業(yè)提供高質(zhì)量AI數(shù)據(jù)服務的標貝科技審時度勢,提前瞄定大模型作為新的技術(shù)底座賦能,不斷對自研的AI數(shù)據(jù)標注平臺進行迭代升級,搭載AI模型的自動化標注能力,更高效地處理高復雜度的數(shù)據(jù)標注任務,實現(xiàn)規(guī);瘮(shù)據(jù)生產(chǎn)。

  標貝科技AI自動標注基于大模型完善的知識儲備以及強大的泛化能力,能夠?qū)崿F(xiàn)對于音頻、文本、圖像和點云等多種數(shù)據(jù)內(nèi)容的理解和分析,根據(jù)需要對通用場景和定制化場景數(shù)據(jù)格式化處理和輸出,在保證高效處理的前提下,又能夠確保標注結(jié)果的高準確率。

  同時,標貝科技基于大模型的底座,針對特定場景,進行模型的快速調(diào)優(yōu),實現(xiàn)3D點云、2D圖像等場景下,目標檢測、目標追蹤、車道線識別、可行駛區(qū)域識別、圖像分割、點云分割等多個方向的自動化標注,極大的提升標注效率和質(zhì)量,降低人工成本。

  ●3D點云追蹤標注場景

  在實際項目中,經(jīng)常出現(xiàn)不同幀采集的數(shù)據(jù)截斷、遮擋角度變化,或者標注員主觀偏差,導致標注效率降低,使得整個標注周期成倍增加等問題。

  就此問題,標貝科技基于AI自動標注能力對點云連續(xù)幀數(shù)據(jù)進行預處理,通過濾波、降采樣、重采樣等操作優(yōu)化點云文件。然后使用預處理模型進行特征提取,將相同物體進行目標關(guān)聯(lián)匹配,設(shè)定同一trackID,以達到對同一物體進行追蹤標記。保持數(shù)據(jù)標注的一致性,減少主觀偏差,縮短工期。

image.png

  ●視頻車牌追蹤場景

  標貝科技AI自動標注模型可以支持上百種物體識別,采用多目標追蹤算法對每個目標進行標識,并通過目標的特征信息來實現(xiàn)目標連續(xù)追蹤。將同一物體識別后,再把標注結(jié)果賦予同一追蹤對象。

  例如,在視頻追蹤對齊車輛并標記出車輛車牌項目中,由于每段視頻較長,需要標注的幀數(shù)達到幾千幀,特別是視頻里遠處的車輛無法很好的提取特征,使得標注難度大幅提升。

  針對以上難點,標貝科技將此項目進行步驟拆解:

  (1)模型識別:通過目標檢測模型對所需標注車輛進行預識別;

  (2)模型追蹤:通過特征匹配深度學習追蹤等算法,對同一物體在上千幀的數(shù)據(jù)中標記出同一track;

  (3)車牌OCR:找到最清晰的一幀并進行OCR車牌識別,并將這個車牌賦予相同track屬性。

image.png

  ●OCR小票識別場景

  在對大量不同類型的購物小票的內(nèi)容進行定位和分類時,由于小票上含有各種干擾字體給標注識別帶來一定難度。

  標貝科技利用AI模型自動對小票整體進行識別,去除小票上的干擾信息。然后OCR模型算法對小票上的信息進行定位和識別,將識別出的文字內(nèi)容通過大模型數(shù)據(jù)理解,分類出文字的商品、價格、編號等屬性類別。

image.png

  ●2D圖像與視頻交互分割場景

  平均1.5分鐘一段的4K視頻,每秒30幀,抽幀后每份作業(yè)2000幀+,大量重復類似的分割工作就需要大量的人工成本。這時就需要利用模型能力快速完成標注。

  基于深度學習的分割方法,標貝科技通過圖片像素分割模型對首幀進行智能分割,然后再將首幀分割結(jié)果,通過追蹤模型自動向后續(xù)目標幀進行追蹤對齊。整體過程中,標貝科技利用多目標追蹤技術(shù),在場景中對多個物體進行智能追蹤,將大量重復性的工作交由模型自動完成。

image.png

  ●ASR長語音標注場景

  當語音數(shù)據(jù)的音頻質(zhì)量較低,又有大量的要劃段及轉(zhuǎn)錄的內(nèi)容,在同音字和多音字干擾下,通過輸入法打字,速度慢效率低。

  標貝科技AI自動標注模型使用VAD能力自動切分,檢測語音信號中的有效語音部分,然后基于自動語音識別技術(shù),將語音信號轉(zhuǎn)換為對應文本。

image.png

  目前,標貝科技已經(jīng)對數(shù)據(jù)平臺系統(tǒng)做了全面升級,在全棧數(shù)據(jù)標注場景式中使用AI自動標注的能力,并得到顯著成效。相較于過去的純?nèi)斯俗,獲取同等數(shù)量的數(shù)據(jù)樣本,AI自動標注的周期至少可以提效70%以上,大幅降低數(shù)據(jù)生產(chǎn)成本。

  面對未來AI產(chǎn)業(yè)的規(guī);虡I(yè)落地趨勢,數(shù)據(jù)標注需求急劇上升,同時數(shù)據(jù)標注場景逐漸向個性化、復雜化的垂類進化。

  標貝科技AI自動標注技術(shù)依托先進的機器學習算法,能夠快速處理大規(guī)模、多類型的數(shù)據(jù),準確識別數(shù)據(jù)中的目標,進行高精度的標注。同時在標注過程中,不斷根據(jù)標注結(jié)果與實際結(jié)果的差異進行自我修正,調(diào)整模型參數(shù),提高標注準確率,為各種垂直場景提供實時、準確的數(shù)據(jù)支持。

  此外,標貝科技還將進一步優(yōu)化平臺工具鏈,通過算法自動標注+人工校對,做到人機全鏈路高效結(jié)合,實現(xiàn)數(shù)據(jù)生產(chǎn)閉環(huán)流程,全方位提升數(shù)據(jù)生產(chǎn)及管理流程的效率。

免責聲明:本文僅代表作者個人觀點,與每日科技網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

本網(wǎng)站有部分內(nèi)容均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,若因作品內(nèi)容、知識產(chǎn)權(quán)、版權(quán)和其他問題,請及時提供相關(guān)證明等材料并與我們聯(lián)系,本網(wǎng)站將在規(guī)定時間內(nèi)給予刪除等相關(guān)處理.