語(yǔ)言大模型(LLM)主導(dǎo)的生成式AI(GenAI)毫無(wú)疑問(wèn)將是未來(lái)幾年最重要的生產(chǎn)力工具,不但突破以前AI應(yīng)用無(wú)法突破的極限,而且將重塑各行各業(yè),并深刻改變企業(yè)的各個(gè)產(chǎn)業(yè)環(huán)節(jié)。
“未來(lái)已至,只是還沒(méi)有均勻分布”。隨著數(shù)據(jù)量的爆炸性增長(zhǎng)、高度可擴(kuò)展的算力的普及、算法的突破,以及機(jī)器學(xué)習(xí)技術(shù)與工具等的不斷進(jìn)步,生成式AI登上了時(shí)代的舞臺(tái)。那么企業(yè)如何開(kāi)啟GenAI的新征程呢?
7月6日,2023世界人工智能大會(huì)(WAIC)在上海隆重開(kāi)幕。作為2023世界人工智能大會(huì)的戰(zhàn)略合作伙伴,第六次參加的星環(huán)科技發(fā)揮大數(shù)據(jù)基礎(chǔ)軟件方面的優(yōu)勢(shì),在大會(huì)上展出了大模型應(yīng)用開(kāi)發(fā)全周期的技術(shù)和產(chǎn)品,在算力及基礎(chǔ)軟件層,包括星環(huán)分布式向量數(shù)數(shù)據(jù)庫(kù)Hippo、分布式圖數(shù)據(jù)庫(kù)StellarDB、大數(shù)據(jù)開(kāi)發(fā)工具TDS等眾多的基礎(chǔ)軟件與工具;在開(kāi)發(fā)者工具層,提供了大模型統(tǒng)一運(yùn)營(yíng)管理平臺(tái)Sophon LLMOps等,實(shí)現(xiàn)對(duì)模型訓(xùn)練、調(diào)優(yōu);在應(yīng)用層則是面向用戶(hù)的領(lǐng)域大模型,如星環(huán)無(wú)涯Infinity和星環(huán)SoLar求索。
同時(shí),7月7日,星環(huán)科技還將在WAIC上舉辦“大模型時(shí)代的未來(lái)數(shù)據(jù)技術(shù)”論壇,讓大數(shù)據(jù)智能化、多模態(tài)、平民化,將擁有廣闊前景的GenAI技術(shù)提交給每一個(gè)企業(yè)用戶(hù)手中,讓企業(yè)開(kāi)啟大模型和生成式AI應(yīng)用的新征程!
企業(yè)自有大模型應(yīng)用構(gòu)建流程圖
金融、能源、交通等每個(gè)行業(yè)都會(huì)有自己的領(lǐng)域大模型
星環(huán)科技創(chuàng)始人、CEO孫元浩在大會(huì)上表示,未來(lái)在金融、政府、能源、交通等每一個(gè)行業(yè)與領(lǐng)域,都會(huì)誕生領(lǐng)域或者行業(yè)的大模型,這些大模型具有專(zhuān)家的能力,可以在上面構(gòu)造復(fù)雜的應(yīng)用。
在特定領(lǐng)域,領(lǐng)域大模型將會(huì)成為發(fā)展的主流。比如金融行業(yè),會(huì)出現(xiàn)金融量化大模型,為基金經(jīng)理投資提供決策輔助支持;在傳統(tǒng)行業(yè)比如冶金領(lǐng)域,基于大模型驅(qū)動(dòng)的控制技術(shù)應(yīng)用將得到快速發(fā)展等。
在領(lǐng)域大模型落地和發(fā)展中,不僅需要長(zhǎng)期積累高質(zhì)量的數(shù)據(jù)、經(jīng)驗(yàn)、流程和知識(shí),利用行業(yè)積累對(duì)領(lǐng)域模型調(diào)優(yōu),利用業(yè)務(wù)反饋持續(xù)提升大模型,而且需要擁有基礎(chǔ)領(lǐng)域模型、基礎(chǔ)開(kāi)發(fā)軟件、基礎(chǔ)工具軟件,以保證行業(yè)領(lǐng)域大模型的持續(xù)提升。
由于大模型反饋的結(jié)果是基于對(duì)訓(xùn)練語(yǔ)料的學(xué)習(xí)而產(chǎn)生的答案,因此行業(yè)大模型在具體的落地過(guò)程中,需要學(xué)習(xí)大量行業(yè)的專(zhuān)精語(yǔ)料和經(jīng)驗(yàn)知識(shí),才能確保返回結(jié)果的精準(zhǔn)性和專(zhuān)業(yè)度。
在大模型應(yīng)用的實(shí)際業(yè)務(wù)工作中,往往會(huì)因?yàn)樾掳l(fā)布的政策法規(guī)、新發(fā)生的行業(yè)重大事件,以及的生產(chǎn)經(jīng)營(yíng)情況變化等,需要做出快速響應(yīng)。相應(yīng)地,基于歷史語(yǔ)料和經(jīng)驗(yàn)知識(shí)訓(xùn)練的領(lǐng)域大模型要想對(duì)瞬息萬(wàn)變的經(jīng)營(yíng)環(huán)境做出及時(shí)的策略調(diào)整和反饋,就需要不斷通過(guò)新增訓(xùn)練語(yǔ)料和實(shí)時(shí)信息來(lái)進(jìn)行反饋結(jié)果的調(diào)優(yōu)。
大模型提出了一種新的人機(jī)交互范式,但“一招鮮吃遍天”的大一統(tǒng)解決方案較難實(shí)現(xiàn),圍繞大模型在完成對(duì)已有業(yè)務(wù)的增值和創(chuàng)新中,需要使用向量數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)、知識(shí)圖譜、大模型編排和構(gòu)建工具等,彌補(bǔ)大模型本身的實(shí)時(shí)性、幻覺(jué)缺陷或者長(zhǎng)輸入難題,組合、串聯(lián)、增強(qiáng)各業(yè)務(wù)零散方案,統(tǒng)一到大模型的交互范式中去。
孫元浩認(rèn)為,在現(xiàn)有數(shù)字化和智能化轉(zhuǎn)型中,我國(guó)應(yīng)該構(gòu)建供應(yīng)鏈安全的、自主可控的、豐富的、可信的大模型生態(tài),并直接對(duì)業(yè)務(wù)的增強(qiáng)、融合、創(chuàng)新做出價(jià)值貢獻(xiàn)。
星環(huán)科技作為一家大數(shù)據(jù)基礎(chǔ)軟件供應(yīng)商,依然會(huì)專(zhuān)注在基礎(chǔ)軟件領(lǐng)域,將致力于做好兩點(diǎn):一是為行業(yè)提供一系列基礎(chǔ)軟件和工具,結(jié)合客戶(hù)的行業(yè)知識(shí)、行業(yè)積累,讓客戶(hù)、合作伙伴能夠打造出自己的行業(yè)領(lǐng)域大模型,并在大模型上開(kāi)發(fā)出AI應(yīng)用;二是在擅長(zhǎng)的領(lǐng)域研發(fā)領(lǐng)域基礎(chǔ)大模型,使得大數(shù)據(jù)取數(shù)分析等這一專(zhuān)業(yè)過(guò)程變得更加平民化。
星環(huán)無(wú)涯Infinity和星環(huán)SoLar求索兩大領(lǐng)域大模型亮相
目前通用大模型商業(yè)化落地面臨不少問(wèn)題,如大模型雖然在理解人類(lèi)自然語(yǔ)言、歸納生成文本、圖像生成上等有驚人的表現(xiàn),但是它依然無(wú)法理解行業(yè)術(shù)語(yǔ),也不能夠執(zhí)行行業(yè)的特定任務(wù),還不能像專(zhuān)家一樣,針對(duì)行業(yè)做分析、推理和決策。
另一方面,企業(yè)要構(gòu)建行業(yè)大模型,需要投資算力、基礎(chǔ)大模型、LLMOps工具鏈、語(yǔ)料庫(kù)、訓(xùn)練指令集,還需進(jìn)行上層應(yīng)用的開(kāi)發(fā)。同時(shí),大模型訓(xùn)練的成本很高,導(dǎo)致其生成的內(nèi)容中數(shù)據(jù)沒(méi)能及時(shí)更新,同時(shí)大模型還會(huì)存在幻覺(jué)問(wèn)題,需要知識(shí)庫(kù)校正結(jié)果。在具體場(chǎng)景中的商業(yè)化落地,通用大模型還不能滿(mǎn)足準(zhǔn)確、可信、安全、可溯等高需求,還會(huì)存在數(shù)據(jù)安全、倫理等問(wèn)題。
在今年的WAIC上,星環(huán)科技的兩大領(lǐng)域大模型——金融領(lǐng)域大模型“無(wú)涯”(Infinity)和大數(shù)據(jù)分析大模型“求索”(SoLar)成功化解以上挑戰(zhàn),開(kāi)始投入應(yīng)用,受到用戶(hù)的歡迎。
其中,星環(huán)無(wú)涯Transwarp Infinity支持股票、債券、基金、商品等市場(chǎng)事件的全面復(fù)盤(pán)、總結(jié)及演繹推理,以及政策研報(bào)的深度分析,為基金經(jīng)理提供決策輔助。
具體而言,星環(huán)無(wú)涯Transwarp Infinity金融大模型是業(yè)界面向金融智能量化投研的領(lǐng)域大模型,將在金融投研、量化投資和智能推理領(lǐng)域大顯身手,有力輔助分析師、研究員和投資經(jīng)理的日常工作,幫助企業(yè)更好地應(yīng)對(duì)復(fù)雜的市場(chǎng)環(huán)境和業(yè)務(wù)需求,持續(xù)促進(jìn)整體行業(yè)的降本增效與科技創(chuàng)新。
星環(huán)無(wú)涯融合了輿情、資金、人物、空間、上下游等多模態(tài)信息,具備強(qiáng)大的理解和生成能力,支持股票、債券、基金、商品等市場(chǎng)事件的全面復(fù)盤(pán)、總結(jié)及演繹推理,以及政策研報(bào)的深度分析;谑录(qū)動(dòng)與深度圖引擎,星環(huán)無(wú)涯支持事件語(yǔ)義刻畫(huà)、定價(jià)因子挖掘、時(shí)序編碼、異構(gòu)關(guān)系圖卷積傳播,進(jìn)而構(gòu)建包含事件沖擊、時(shí)序變化、截面聯(lián)動(dòng)和決策博弈等多個(gè)維度的量化投研新范式。
從應(yīng)用上看,無(wú)涯Infinity金融大模型擁有海量金融專(zhuān)業(yè)語(yǔ)料和輿情工商產(chǎn)業(yè)鏈大宗衛(wèi)星等多源數(shù)據(jù),可溯因的標(biāo)準(zhǔn)化因子和歸因解釋體系,高精準(zhǔn)、強(qiáng)邏輯的事理分析與推斷力,專(zhuān)注于金融領(lǐng)域的大語(yǔ)言模型架構(gòu),背靠大數(shù)據(jù)全生命周期技術(shù)棧等優(yōu)勢(shì)。
而Transwarp SoLar具備大數(shù)據(jù)行業(yè)需求理解、推理、各類(lèi)(含多模型)結(jié)構(gòu)化查詢(xún)語(yǔ)言和OpenCypher代碼生成、文本生成、嵌入向量生成、知識(shí)推理等能力。
借助這一領(lǐng)域大模型,企業(yè)的業(yè)務(wù)人員、數(shù)據(jù)分析人員以及業(yè)務(wù)管理者只需使用自然語(yǔ)言,就能利用Transwarp SoLar大模型獲取所需的數(shù)據(jù)分析、展示和報(bào)告,輕松地應(yīng)對(duì)各種復(fù)雜的數(shù)據(jù)分析挑戰(zhàn),并快速獲得有價(jià)值的數(shù)據(jù)洞察,為企業(yè)的業(yè)務(wù)增長(zhǎng)提供原動(dòng)力。
星環(huán)求索大模型基于通用大語(yǔ)言模型,通過(guò)對(duì)大數(shù)據(jù)分析領(lǐng)域語(yǔ)料的重新訓(xùn)練微調(diào)而產(chǎn)生,相較于通用大語(yǔ)言模型,可以更好地理解大數(shù)據(jù)分析領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ)、縮寫(xiě)、常見(jiàn)詞匯和語(yǔ)法,更適合用于大數(shù)據(jù)分析領(lǐng)域的自然語(yǔ)言處理任務(wù)。星環(huán)求索讓非專(zhuān)業(yè)用戶(hù)在無(wú)需掌握數(shù)據(jù)庫(kù)編程語(yǔ)言的前提下,能夠通過(guò)自然語(yǔ)言進(jìn)行自由的數(shù)據(jù)查詢(xún)、分析和展示。
星環(huán)求索大數(shù)據(jù)分析大模型擁有眾多優(yōu)勢(shì),包括行業(yè)基因,在大數(shù)據(jù)分析領(lǐng)域擁有超過(guò)10年的積累,深刻了解該行業(yè)的需求和挑戰(zhàn);性能優(yōu)異,基于Sophon LLMOps大模型開(kāi)發(fā)工具進(jìn)行大模型的微調(diào),性能表現(xiàn)遠(yuǎn)勝開(kāi)源模型;迭代提升,自主研發(fā)了SQL眾包工具,持續(xù)根據(jù)數(shù)據(jù)驅(qū)動(dòng)來(lái)提升模型性能;支持多模,產(chǎn)品支持TDH多模型查詢(xún)語(yǔ)法,可以查詢(xún)一切可查詢(xún)的數(shù)據(jù)等。
大模型基礎(chǔ)開(kāi)發(fā)軟件與工具讓企業(yè)便捷構(gòu)建領(lǐng)域大模型
在WAIC上星環(huán)科技另一個(gè)吸睛的地方就是為領(lǐng)域大模型發(fā)展提供的一系列基礎(chǔ)軟件和工具,不僅包括模型持續(xù)提升和持續(xù)開(kāi)發(fā)工具Sophon LLMOps,可以對(duì)大模型進(jìn)行微調(diào),也包括向量數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)、知識(shí)圖譜等軟件,讓客戶(hù)、合作伙伴能夠打造出自己的行業(yè)領(lǐng)域大模型,并在大模型上開(kāi)發(fā)出AI應(yīng)用。
作為星環(huán)科技自主研發(fā)的一款綜合性大模型統(tǒng)一運(yùn)營(yíng)管理平臺(tái),Sophon LLMOps為用戶(hù)打通從數(shù)據(jù)接入和開(kāi)發(fā)、提示工程、大模型微調(diào)、大模型上架部署到大模型應(yīng)用編排和業(yè)務(wù)效果對(duì)齊的全鏈路流程,從而實(shí)現(xiàn)針對(duì)大模型的數(shù)據(jù)和分析的持續(xù)提升。
針對(duì)智能問(wèn)答系統(tǒng)在各個(gè)業(yè)務(wù)環(huán)節(jié)中的應(yīng)用需求,Sophon LLMOps提供了領(lǐng)域智能問(wèn)答解決方案。借助星環(huán) Sophon LLMOps,用戶(hù)可以輕松完成數(shù)據(jù)采集、知識(shí)沉淀、大模型迭代提升的完整閉環(huán)。通過(guò)跨領(lǐng)域知識(shí)的學(xué)習(xí)和調(diào)優(yōu),大語(yǔ)言模型能更好地理解不同領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ)、縮寫(xiě)、常見(jiàn)詞匯和語(yǔ)法,承擔(dān)統(tǒng)一的語(yǔ)義理解功能,解決業(yè)務(wù)領(lǐng)域性問(wèn)題。
作為一款企業(yè)級(jí)云原生分布式向量數(shù)據(jù)庫(kù),星環(huán)分布式向量數(shù)據(jù)庫(kù)Hippo支持存儲(chǔ)、索引以及管理海量的向量式數(shù)據(jù)集,提供向量相似度檢索、高密度向量聚類(lèi)等能力,有效地解決了大模型在知識(shí)時(shí)效性低、輸入能力有限、準(zhǔn)確度低等問(wèn)題,讓大模型更高效率地存儲(chǔ)和讀取知識(shí)庫(kù),降低訓(xùn)練和推理成本,激發(fā)更多的AI應(yīng)用場(chǎng)景。
在賦予大模型擁有“長(zhǎng)期記憶”的同時(shí),Hippo還可以協(xié)助企業(yè)解決目前最擔(dān)憂(yōu)的大模型數(shù)據(jù)隱私泄露問(wèn)題。通過(guò)建立垂直領(lǐng)域的知識(shí)庫(kù),對(duì)大模型輸出結(jié)果進(jìn)行校正,可以提高結(jié)果的精準(zhǔn)度,在一定程度上解決“AI幻覺(jué)”問(wèn)題。此外,通過(guò)星環(huán)Hippo對(duì)向量數(shù)據(jù)進(jìn)行存儲(chǔ),有效解除大模型對(duì)輸入的限制,并且大模型在安全機(jī)制下訪(fǎng)問(wèn)向量數(shù)據(jù)庫(kù)中的隱私數(shù)據(jù),可以充分保證數(shù)據(jù)安全,杜絕隱私泄露風(fēng)險(xiǎn)。
星環(huán)分布式圖數(shù)據(jù)庫(kù)StellarDB和知識(shí)圖譜平臺(tái)Sophon KG聯(lián)合,與大模型可視化端到端構(gòu)建工具一起,提供了知識(shí)抽取融合、知識(shí)建模、知識(shí)圖譜生成存儲(chǔ)、基于大模型的知識(shí)問(wèn)答等閉環(huán)功能?蛻(hù)以知識(shí)圖譜作為大語(yǔ)言模型提示即可發(fā)起模型微調(diào),以較低代價(jià)就可獲得行業(yè)的專(zhuān)屬大語(yǔ)言模型問(wèn)答應(yīng)用。
將向量數(shù)據(jù)庫(kù)Hippo、圖數(shù)據(jù)庫(kù)StellarDB等與大語(yǔ)言模型結(jié)合,可以更低成本、更高效地構(gòu)建特定領(lǐng)域的大模型應(yīng)用,可以解決大模型目前存在的三大問(wèn)題:一是能夠把實(shí)時(shí)的知識(shí)、變化的信息放到大模型中;二是能夠校正結(jié)果的準(zhǔn)確性,極大地提升精準(zhǔn)度;三是構(gòu)建相應(yīng)的知識(shí)圖譜,增強(qiáng)大模型的能力。
另外,針對(duì)目前各行業(yè)用戶(hù)在落地廣泛業(yè)務(wù)需求分析、處理多重?cái)?shù)據(jù)模態(tài)對(duì)接、跟進(jìn)高度定制場(chǎng)景問(wèn)題解決、運(yùn)營(yíng)多源多框架AI模型等方面的問(wèn)題,星環(huán)科技自主研發(fā)的一站式智能分析工具平臺(tái)Sophon提供“六易三倉(cāng)兩中心”的功能服務(wù),能夠保障企業(yè)數(shù)據(jù)到智能應(yīng)用的落地,實(shí)現(xiàn)AI能力平民化、AI價(jià)值化。
例如某制造業(yè)客戶(hù)通過(guò)Sophon的AI技術(shù)以及視頻、圖像、時(shí)序等多模態(tài)數(shù)據(jù)的聯(lián)合分析技術(shù),對(duì)其生產(chǎn)的鋼管材進(jìn)行缺陷檢測(cè)識(shí)別,支持夾渣、未焊透、未熔合、氣孔、裂紋5類(lèi)基本缺陷類(lèi)型的識(shí)別,并支持新增和識(shí)別隨著日常的生產(chǎn)不斷涌現(xiàn)的新缺陷。
某德國(guó)汽車(chē)品牌基于Sophon的多模態(tài)數(shù)據(jù)分析能力,盤(pán)活了監(jiān)管機(jī)構(gòu)、來(lái)源網(wǎng)站、法規(guī)條款(PDF等)等多模態(tài)的存量數(shù)據(jù),并且通過(guò)文本分析、詞法分析、糾錯(cuò)和統(tǒng)一轉(zhuǎn)換等文本理解和意圖識(shí)別模型,實(shí)現(xiàn)了數(shù)據(jù)知識(shí)沉淀,以及行業(yè)法規(guī)條款的自動(dòng)語(yǔ)義檢索和問(wèn)答,幫助內(nèi)部員工快速觸達(dá)監(jiān)管條款細(xì)節(jié),提升效率。
利用星環(huán)科技的基礎(chǔ)開(kāi)發(fā)軟件與工具,企業(yè)都可以便捷構(gòu)建領(lǐng)域大模型,讓生成式AI應(yīng)用服務(wù)企業(yè)業(yè)務(wù)創(chuàng)新。
7月7日-8日,2023WAIC-星環(huán)科技精彩繼續(xù)。
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與每日科技網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
本網(wǎng)站有部分內(nèi)容均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),若因作品內(nèi)容、知識(shí)產(chǎn)權(quán)、版權(quán)和其他問(wèn)題,請(qǐng)及時(shí)提供相關(guān)證明等材料并與我們聯(lián)系,本網(wǎng)站將在規(guī)定時(shí)間內(nèi)給予刪除等相關(guān)處理.
精彩推薦
-
采購(gòu)拿回扣問(wèn)題,教你一個(gè)小妙招,看看怎么做!
2017-09-18 11:09 廣告 閱讀
-
苦逼的老板,教你一個(gè)小妙招,怎么防采購(gòu)拿回扣!
2017-09-18 11:09 廣告 閱讀
-
傳播易推出商機(jī)寶“客戶(hù)推薦”功能 今天正式上
2021-01-05 17:10:46 更新 閱讀
-
尖貨爆料!速來(lái)【數(shù)碼預(yù)爆臺(tái)】領(lǐng)取618福利和AI新
2024-06-21 18:33:22 更新 閱讀
-
喜獲國(guó)際設(shè)計(jì)大獎(jiǎng)丨十字勛章減重大師Pro商務(wù)背包
2024-06-12 14:04:28 更新 閱讀
-
Baseus倍思音頻品鑒會(huì):一場(chǎng)產(chǎn)品與技術(shù)的對(duì)話(huà)
2024-05-29 11:13:32 更新 閱讀
-
212攜手極致軍工品質(zhì),煥新出發(fā)
2024-05-22 21:16:00 更新 閱讀
-
第四屆全球應(yīng)用算法BPAA大賽再度升級(jí),增添三大
2024-05-17 17:55:36 更新 閱讀
-
三維天地助力實(shí)驗(yàn)室質(zhì)量管理工作無(wú)紙化、流程化
2024-05-09 15:35:04 更新 閱讀