超越聊天机器人：嵌入的广阔世界-DG城市

大型语言模型（LLM）的日益普及也引起了人们对嵌入模型的兴趣，深度学习系统将不同数据类型的特征压缩为数值表示。

嵌入模型是检索增强生成（RAG）的关键组成部分之一，是LLM在企业中的重要应用之一。但嵌入模型的潜力超出了当前的 RAG 应用。在过去的一年里，嵌入式应用取得了令人瞩目的进展，2024 年有望有更多的库存。

嵌入的工作原理

嵌入的基本思想是将一段数据（如图像或文本文档）转换为表示其最重要特征的数字列表。嵌入模型在大型数据集上进行训练，以学习最相关的特征，这些特征可以区分不同类型的数据。

例如，在计算机视觉中，嵌入可以表示重要特征，例如某些对象、形状、颜色或其他视觉模式的存在。在文本应用程序中，嵌入可以对语义信息进行编码，例如概念、地理位置、人员、公司、对象等。

在 RAG 应用程序中，嵌入模型用于对公司文档的特征进行编码。然后，每个文档的嵌入都存储在向量存储中，这是一个专门用于记录和比较嵌入的数据库。在推理时，应用程序计算新提示的嵌入，并将其发送到向量数据库，以检索嵌入值最接近提示值的文档。然后将相关文档的内容插入到提示中，并指示 LLM 根据这些文档生成响应。

这种简单的机制在定制 LLM 以根据其训练数据中未包含的专有文档或信息进行响应方面发挥着重要作用。它还有助于解决幻觉等问题，其中 LLM 由于缺乏适当的信息而产生虚假事实。

超越基本的 RAG

虽然 RAG 一直是 LLM 的重要补充，但检索和嵌入的好处不仅仅是将提示与文档匹配。

“嵌入主要用于检索（也许用于概念的良好可视化），”LlamaIndex首席执行官Jerry Liu告诉VentureBeat。 “但检索本身实际上非常广泛，并且超出了简单的聊天机器人的问答范围。

Liu说，检索可以成为任何LLM用例的核心步骤。 LlamaIndex 一直在创建工具和框架，允许用户将 LLM 提示与其他类型的任务和数据相匹配，例如向 SQL 数据库发送命令、从结构化数据中提取信息、长格式生成或可以自动化工作流的代理。

“[检索]是向LLM增加相关上下文的核心一步，我认为大多数企业LLM用例都需要至少以某种形式进行检索，”Liu说。

嵌入还可用于简单文档检索以外的应用程序。例如，在最近的一项研究中，伊利诺伊大学厄巴纳-香槟分校和清华大学的研究人员使用嵌入模型来降低训练编码LLM的成本。他们开发了一种技术，该技术使用嵌入来选择数据集的最小子集，该子集也是多样化的，并且代表了LLM必须完成的不同类型的任务。这使他们能够用更少的示例来训练高质量的模型。