星環(huán)科技向量數(shù)據(jù)庫Transwarp Hippo自發(fā)布已來,受到了眾多用戶的歡迎,幫助用戶實現(xiàn)向量數(shù)據(jù)的存儲、管理和檢索,探索和實踐大模型場景。在與用戶不斷地深入交流以及實踐中,Hippo迎來了V1.1版本,一套系統(tǒng)即可支持向量與全文聯(lián)合檢索,提高文本數(shù)據(jù)的召回精度,從而提升大語言模型應用的準確率。同時,Hippo1.1新增余弦距離、批量數(shù)據(jù)導入導出、Explain與Profile支持、ARM架構支持等能力,大幅降低用戶使用門檻和成本。
此外,Hippo社區(qū)版同樣支持以上新特性,點擊文末閱讀原文或者訪問星環(huán)科技官網(wǎng),即可申請下載體驗,開啟大語言模型場景探索之旅。
一庫搞定向量+全文聯(lián)合檢索,提升大模型準確率
在大語言模型應用中,向量數(shù)據(jù)庫作為中間載體,可以有效地解決大模型在知識時效性低、輸入能力有限、準確度低等問題,賦予大模型擁有“長期記憶”。因此,向量數(shù)據(jù)庫的召回精度直接影響大模型輸出結果的準確率。然而,在一些實踐場景中,對于向量數(shù)據(jù)庫本身而言,單一使用向量檢索會產(chǎn)生召回準確率不高的問題:
* 對噪聲和冗余信息敏感:若向量數(shù)據(jù)庫中存在大量的噪聲和冗余信息,則檢索的準確率會降低;
* 對特征選擇的依賴:在向量檢索中,需要對數(shù)據(jù)進行特征提取和選擇,若特征選擇不當,則會影響檢索的準確性;
* 對查詢語義理解的局限性:當查詢語義比較復雜或模糊時,向量檢索無法準確理解用戶的意圖,導致準確率降低;
此外,像一些特殊情況,如所檢索內容未構建特征或特征比重較小時,會導致準確率降低,甚至無召回結果。
針對文本搜索場景,全文檢索更適合做關鍵字匹配,可以避免檢索內容低頻的問題。而向量檢索則能找出字面上不同但語義上相近的內容。通過將向量檢索和全文檢索的聯(lián)合召回,可以降低漏檢和誤檢的概率,能夠實現(xiàn)比單獨使用向量或全文檢索更高的精度。
此外,向量數(shù)據(jù)與全文數(shù)據(jù)在存儲、計算上有很大的差別,單一的數(shù)據(jù)庫架構很難同時高效支持這兩種場景。例如,對于公開數(shù)據(jù)集如ANN Benchmark,Elasticsearch的性能遠落后于專業(yè)的向量數(shù)據(jù)庫。
星環(huán)科技向量數(shù)據(jù)庫Hippo底層使用自研的分布式數(shù)據(jù)管理系統(tǒng)TDDMS,能夠支持向量數(shù)據(jù)和全文數(shù)據(jù)統(tǒng)一存儲管理,一套數(shù)據(jù)庫系統(tǒng)即可支持向量與全文數(shù)據(jù)聯(lián)合檢索召回,避免了部署多套系統(tǒng)帶來的架構復雜、開發(fā)運維成本高等問題。同時,Hippo1.1提供兼容Elasticsearch協(xié)議的SDK支持,方便用戶更便捷地使用向量數(shù)據(jù)庫。
例如,當查詢“A公司業(yè)務發(fā)展情況”時,通過向量檢索可以檢索出A公司“主要業(yè)務”、“經(jīng)營模式”、“財務情況”、“市場地位”等信息,通過全文檢索可以檢索出知識庫中和關鍵字“業(yè)務”、“發(fā)展”相關的結果作為補充,通過將兩者檢索的結果進行結合,可以使得大模型回答的結果更加豐滿和準確。
當查詢“A公司產(chǎn)品經(jīng)理B的履歷”時,若該產(chǎn)品經(jīng)理B在知識庫中出現(xiàn)的頻率較低或未構建特征時,單一使用向量檢索召回的結果可能主要是A公司介紹,而通過全文檢索則會檢索出產(chǎn)品經(jīng)理B相關的內容,通過向量+全文的聯(lián)合檢索召回,使得大模型能夠準確地給出答案。
多個新特性升級,幫助用戶實現(xiàn)降本增效
1、余弦距離支持,簡化業(yè)務邏輯
余弦距離在大模型領域有著廣泛的應用。在過去,用戶在將向量數(shù)據(jù)導入向量數(shù)據(jù)庫之前,需要對數(shù)據(jù)庫做L2歸一化,并搭配內積距離間接實現(xiàn)余弦距離,這個過程較為復雜,需要用戶手工操作,并要求有一定的技術基礎。Hippo1.1新增原生的余弦距離支持,用戶不再需要通過向量歸一化計算 IP metrics 來使用余弦距離,大幅簡化了業(yè)務邏輯,降低了用戶使用門檻。
2、批量數(shù)據(jù)導入導出,加速數(shù)據(jù)流轉
Hippo1.1新增基于csv格式的批量數(shù)據(jù)導入導出功能,方便用戶進行數(shù)據(jù)流轉。此外,用戶還可以通過Python、Restful等API進行數(shù)據(jù)操作。
3、支持ARM架構,滿足國產(chǎn)化需求
隨著 ARM架構 CPU 的普及程度越來越高,Hippo1.1在支持X86架構的基礎上,新增支持ARM架構,滿足企業(yè)用戶國產(chǎn)化需求。
4、支持Explain與Profile,高效性能優(yōu)化
當執(zhí)行帶過濾條件的向量檢索時,Hippo會根據(jù)過濾條件預估過濾率,選擇的搜索路徑。通過Explain接口,用戶可以準確地看到檢索的具體執(zhí)行路徑,通過Profile接口,用戶可以看到一次搜索中各階段的細分耗時情況;谶@兩點特性,用戶可以更高效地進行數(shù)據(jù)庫調試、問題排查和性能優(yōu)化。
免責聲明:本文僅代表作者個人觀點,與每日科技網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
本網(wǎng)站有部分內容均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,若因作品內容、知識產(chǎn)權、版權和其他問題,請及時提供相關證明等材料并與我們聯(lián)系,本網(wǎng)站將在規(guī)定時間內給予刪除等相關處理.
精彩推薦
-
采購拿回扣問題,教你一個小妙招,看看怎么做!
2017-09-18 11:09 廣告 閱讀
-
苦逼的老板,教你一個小妙招,怎么防采購拿回扣!
2017-09-18 11:09 廣告 閱讀
-
傳播易上線視頻制作頻道
2020-11-18 14:03:07 更新 閱讀
-
尖貨爆料!速來【數(shù)碼預爆臺】領取618福利和AI新
2024-06-21 18:33:22 更新 閱讀
-
喜獲國際設計大獎丨十字勛章減重大師Pro商務背包
2024-06-12 14:04:28 更新 閱讀
-
Baseus倍思音頻品鑒會:一場產(chǎn)品與技術的對話
2024-05-29 11:13:32 更新 閱讀
-
212攜手極致軍工品質,煥新出發(fā)
2024-05-22 21:16:00 更新 閱讀
-
第四屆全球應用算法BPAA大賽再度升級,增添三大
2024-05-17 17:55:36 更新 閱讀
-
三維天地助力實驗室質量管理工作無紙化、流程化
2024-05-09 15:35:04 更新 閱讀