国产精品成人不卡乱码,三年在线观看免费观看完整版中文,亚洲AV午夜精品无码专区在线

基于LLM+向量庫的文檔對話經(jīng)驗(yàn)面 PDF 下載

匿名網(wǎng)友發(fā)布于：2025-04-03 09:22:55

(侵權(quán)舉報(bào))

(假如點(diǎn)擊沒反應(yīng)，多刷新兩次就OK！)

基于LLM+向量庫的文檔對話經(jīng)驗(yàn)面 PDF 下載圖1

資料內(nèi)容：

一、基于LLM+向量庫的文檔對話基礎(chǔ)面

1.1 為什么大模型需要外掛(向量)知識庫？

如何將外部知識注入大模型，最直接的方法：利用外部知識對大模型進(jìn)行微調(diào)

既然大模型微調(diào) 不是將外部知識注入大模型的最優(yōu)方案，那是否有其它可行方案？

1.2. 基于LLM+向量庫的文檔對話思路是怎么樣？

版本一

• 思路：構(gòu)建幾十萬量級的數(shù)據(jù)，然后利用這些數(shù)據(jù) 對大模型進(jìn)行微調(diào)，以將額外知識注入大模型

• 優(yōu)點(diǎn)：簡單粗暴

• 缺點(diǎn)：

i. 這幾十萬量級的數(shù)據(jù) 并不能很好的將額外知識注入大模型；

ii. 訓(xùn)練成本昂貴。不僅需要多卡并行，還需要訓(xùn)練很多天；

1. 加載文件

2. 讀取文本

3. 文本分割

4. 文本向量化

5. 問句向量化

6. 在文本向量中匹配出與問句向量最相似的top k個

7. 匹配出的文本作為上下文和問題一起添加到 prompt 中

8. 提交給 LLM 生成回答