桐城市网站建设唯品会一家做特卖的网站-吉安市网站建设公司-Seo优化

桐城市网站建设,唯品会一家做特卖的网站,谷歌推广代理商,一级域名网站怎么做简介文章介绍了上下文工程作为解决大模型上下文窗口限制的核心方法#xff0c;通过构建智能系统连接模型与外部世界。详细阐述了六大核心组件#xff1a;智能体(决策核心)、查询增强(意图转化)、检索(知识连接)、提示词技术(指令设计)、记忆(历史保留)和工具(实…简介文章介绍了上下文工程作为解决大模型上下文窗口限制的核心方法通过构建智能系统连接模型与外部世界。详细阐述了六大核心组件智能体(决策核心)、查询增强(意图转化)、检索(知识连接)、提示词技术(指令设计)、记忆(历史保留)和工具(实时交互)强调优秀的大模型应用源于卓越的系统设计而非单纯依赖更大模型。每个使用大型语言模型LLM进行开发的开发者最终都会遇到同样的瓶颈。一开始你会惊叹于模型强大的写作、总结和推理能力但当尝试将其应用于现实问题时漏洞便开始显现它无法回答关于你的私人文档的问题不了解昨天发生的事件在不知道答案时还会自信地编造内容。问题不在于模型的智能程度而在于它本质上是孤立的。它就像一个强大却与世隔绝的大脑无法访问你的特定数据、实时互联网甚至不记得上一次对话的内容。这种孤立状态源于其核心架构限制上下文窗口。上下文窗口是模型的活跃工作记忆——一个有限的空间用于容纳当前任务的指令和信息。每个单词、数字和标点符号都会占用这个窗口的空间。就像一块白板一旦写满旧信息就会被擦除以容纳新指令重要细节也可能因此丢失。仅通过撰写更好的提示词无法解决这一根本性限制你必须在模型周围构建一个系统。这就是上下文工程。上下文工程是一门设计架构的学科旨在适时为大型语言模型提供合适的信息。它不涉及改变模型本身而是构建桥梁将模型与外部世界连接起来检索外部数据对接实时工具并赋予模型记忆能力使其回答基于事实而非仅依赖训练数据。核心组件•智能体统筹信息使用方式和时机的决策核心。•查询增强将模糊、不规范的用户请求转化为精确、机器可理解的意图的技术。•检索连接大型语言模型与你的特定文档和知识库的桥梁。•提示词技术提供清晰、有效的指令以引导模型推理的技能。•记忆赋予应用程序历史感和从交互中学习的能力的系统。•工具让应用程序能够直接采取行动并与实时数据源交互的“双手”。智能体当你开始使用大型语言模型构建实际系统时就会遇到静态流水线的局限性。“检索-生成”的固定流程在简单的检索增强生成RAG场景中效果良好但当任务需要判断、适应或多步骤推理时便会失效。这就是智能体的用武之地。在上下文工程中智能体负责管理信息在系统中的流动方式和效率。与机械遵循脚本不同智能体能够评估已知信息、判断所需补充信息、选择合适工具并在出现问题时调整策略。智能体既是其上下文的构建者也是上下文的使用者。然而它们需要完善的实践和系统进行指导因为良好的上下文管理极具挑战性——事实上糟糕的上下文管理会拖累智能体的所有其他功能。什么是智能体“智能体”一词的使用范围广泛因此我们在大型语言模型开发场景中对其进行定义人工智能智能体是一个能够实现以下功能的系统•对信息流动做出动态决策不遵循预设路径而是根据已获取的信息决定下一步行动。•跨多次交互维持状态与简单的问答系统不同智能体能够记忆已执行的操作并利用这些历史信息指导未来决策。•根据结果调整方法当某种策略无效时能够尝试其他方案。•自适应使用工具能够从可用工具中进行选择并以非预先编程的方式组合使用。单智能体架构由单个智能体处理所有任务适用于中等复杂度的工作流程。多智能体架构将工作分配给多个专门处理特定任务的智能体适用于复杂工作流程但会带来协调挑战。上下文清洁度管理这是智能体系统管理中最关键的环节之一。智能体不仅需要记忆和工具还需要监控和管理自身上下文的质量。这意味着要避免信息过载、检测无关或冲突信息、根据需要精简或压缩信息并保持上下文记忆的清晰度以确保有效推理。上下文窗口挑战由于上下文窗口的信息容量有限大型语言模型的信息处理能力受到约束。这一根本性限制决定了当前智能体及智能体系统的能力边界。智能体在处理信息时需要就以下问题做出决策•哪些信息应保留在活跃的上下文窗口中•哪些信息可以通过总结或压缩节省空间•哪些信息应存储在外部需要时再检索•为推理和规划预留多少空间人们容易认为更大的上下文窗口能解决这个问题但事实并非如此。更长的上下文数十万个甚至约100万个token实际上会带来新的失效模式。往往在模型达到最大token容量之前性能就会开始显著下降智能体可能变得混乱、幻觉率升高或者无法维持正常水平的表现。这不仅是技术限制更是任何人工智能应用程序在设计时都必须面对的核心挑战。随着上下文窗口增大以下常见错误会开始出现或增多•上下文污染错误或虚构的信息进入上下文。由于智能体会重复使用并基于这些上下文进行扩展错误会持续存在并不断累积。•上下文干扰智能体被过多的历史信息历史记录、工具输出、总结拖累过度依赖重复过去的行为而非重新推理。•上下文混淆无关的工具或文档充斥上下文干扰模型并导致其使用错误的工具或指令。•上下文冲突上下文中的矛盾信息误导智能体使其陷入相互冲突的假设中无法决策。智能体的策略与任务智能体之所以能有效协调上下文系统是因为它们具备动态推理和决策能力。以下是智能体为管理上下文而设计的常见任务和采用的策略•上下文总结定期将累积的历史信息压缩为摘要在保留关键知识的同时减轻负担。•自适应检索策略当初次尝试失败时重新构建查询、切换知识库或更改分块策略。•质量验证检查检索到的信息是否一致且有用。•上下文精简通过专门的精简模型或专用大型语言模型工具主动移除无关或过时的上下文。•上下文卸载将细节存储在外部仅在需要时检索而非将所有信息保存在活跃上下文中。•动态工具选择不将所有可能的工具都写入提示词而是由智能体根据任务筛选并加载相关工具减少混淆并提高准确性。•多源合成整合来自多个来源的信息解决冲突生成连贯的答案。智能体在上下文工程中的定位智能体在上下文工程系统中扮演协调者的角色。它们不会替代其他章节介绍的技术而是智能地统筹这些技术。例如当初次搜索失败时智能体可能会应用查询重写根据遇到的内容类型选择不同的分块策略或者决定何时压缩对话历史以容纳新信息。它们提供了必要的编排层能够针对信息管理做出动态、符合上下文的决策。上下文工程系统中不同类型的智能体及其功能•监督智能体负责规划、优化查询、确保效率。•专业智能体包括查询重写器、检索器、答案合成器、工具路由器等。•记忆组件分为短期记忆工作记忆和长期记忆外部知识库。•工具与接口各类工具及应用程序接口。查询增强上下文工程中最重要的步骤之一是如何处理和呈现用户的查询。如果无法准确理解用户的问题大型语言模型就无法提供精准的回答。这听起来简单实则复杂。需要关注两个核心问题1.用户与聊天机器人或输入框的交互方式往往并不理想。许多产品开发者在开发和测试聊天机器人时使用的查询通常简洁、标点规范、表达清晰包含了大型语言模型理解问题所需的所有信息。但在现实场景中用户与聊天机器人的交互可能模糊、混乱且不完整。因此要构建稳健的系统必须实现能够处理各类交互而非仅理想交互的解决方案。2.流水线的不同环节需要以不同方式处理查询。一个大型语言模型能很好理解的问题可能并不适合作为向量数据库的搜索查询反之一个适合向量数据库的查询词可能不足以让大型语言模型生成完整答案。因此我们需要一种能够针对流水线中不同工具和步骤优化查询的方法。请记住查询增强从流水线的最开始就解决了“输入垃圾输出垃圾”的问题。无论检索算法多么复杂、重排序模型多么先进、提示词工程多么巧妙都无法完全弥补对用户意图的误解。查询重写查询重写将原始用户查询转化为更适合信息检索的版本。如今应用程序不再采用“检索-读取”的模式而是转向“重写-检索-读取”的方式。这项技术通过重构表达不规范的问题使其更易被系统理解移除无关上下文引入常用关键词以提高与正确上下文的匹配度还可以将复杂问题拆分为简单的子问题。检索增强生成RAG应用对查询的措辞和特定关键词非常敏感因此该技术通过以下方式发挥作用•重构模糊问题将模糊或表达不当的用户输入转化为精确、信息密集的表述。•上下文移除删除可能干扰检索过程的无关信息。•关键词增强引入常用术语提高匹配相关文档的概率。查询扩展查询扩展通过从单个用户输入生成多个相关查询来增强检索效果。当用户查询模糊、表达不规范或需要更广泛的覆盖范围如基于关键词的检索系统时这种方法能提升结果质量。然而查询扩展也面临一些需要谨慎处理的挑战•查询偏移扩展后的查询可能偏离用户原始意图导致无关结果。•过度扩展添加过多术语可能降低精度检索到大量无关文档。•计算开销处理多个查询会增加系统延迟和资源消耗。查询分解查询分解将复杂、多维度的问题拆分为简单、聚焦的子查询这些子查询可独立处理。这项技术特别适用于需要从多个来源获取信息或涉及多个相关概念的问题。该过程通常包括两个主要阶段•分解阶段大型语言模型分析原始复杂查询并将其拆分为更小的聚焦子查询每个子查询针对原始问题的一个特定方面。•处理阶段每个子查询通过检索流水线独立处理实现与相关文档的更精准匹配。检索完成后上下文工程系统必须汇总并合成所有子查询的结果为原始复杂问题生成连贯、全面的答案。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】查询智能体查询智能体是查询增强的最高级形式它利用人工智能智能体智能处理整个查询处理流水线整合了上述所有技术。查询智能体接收用户的自然语言提示词/问题基于对数据库和数据结构的了解决定查询的最佳构建方式并能根据返回结果迭代地决定重新查询和调整策略。核心步骤1.分析使用生成模型如大型语言模型分析任务和所需查询确定要执行的精确查询。•动态查询构建不依赖预设查询模式而是基于对用户意图和数据模式的理解按需构建查询。这意味着它可以自动添加筛选条件、调整搜索词以在数据库中找到最相关的结果还可以根据需求选择执行搜索、聚合或同时执行两者。2.查询执行构建并向智能体选择的一个或多个数据集发送查询。•多数据集路由智能体了解所有数据集的结构因此能根据用户问题智能决定查询哪些数据集。•评估智能体可以在原始用户查询的上下文中评估检索到的信息。如果存在信息缺失智能体可以尝试其他知识源或新的查询。3.可选响应生成接收数据库返回的结果并使用生成模型为用户的提示词/查询生成最终响应。•上下文感知上下文可能还包括之前的对话历史和其他相关信息。智能体能够维持对话上下文以处理后续问题。检索大型语言模型的性能取决于其可访问的信息。虽然大型语言模型经过了海量数据集的训练但它们无法获取你的特定私人文档以及训练完成后出现的任何信息。要构建真正智能的应用程序必须适时为它们提供合适的外部信息。这一过程称为检索。检索前和检索步骤是许多依赖上下文工程的人工智能架构如检索增强生成RAG的核心组成部分。核心挑战从概念上讲挑战很简单但在实践中却很棘手原始文档数据集通常过大无法放入大型语言模型有限的上下文窗口提供给人工智能模型的输入中。我们不能直接将整套用户手册或研究论文交给模型。相反我们必须从这些文档中找到最关键的部分——即包含用户查询答案的单个段落或章节。为了使庞大的知识库可搜索并找到这一关键部分我们必须首先将文档拆分为更小、更易处理的片段。这一基础性过程称为分块是实现成功检索的关键。分块策略矩阵维度低高检索精度丰富但难以检索精确但不完整上下文丰富度失效区域最佳区域最优分块•精确但不完整过小的分块如单个句子易于查找但缺乏足够的上下文导致大型语言模型无法生成优质响应。•失效区域结构混乱、随机的分块既难以查找又毫无用处是最糟糕的情况。•最佳区域最优分块语义完整的段落既聚焦且易于查找又内容丰富且易于理解。•丰富但难以检索过大的分块包含答案但嵌入向量“噪声”大导致检索系统无法准确找到。设计分块策略时必须平衡两个相互冲突的优先级•检索精度分块需要小巧且聚焦于单一主题。这能生成独特、精确的嵌入向量使向量搜索系统更容易找到与用户查询完全匹配的结果。混合多个主题的大分块会生成“平均化”的噪声嵌入向量难以被精确检索。•上下文丰富度分块必须足够大且独立以便能够被理解。分块被检索后会传递给大型语言模型若分块只是脱离上下文的孤立句子即使是功能强大的模型也难以生成有意义的响应。目标是找到分块的最佳平衡点分块既要足够小以实现精确检索又要足够完整以向大型语言模型提供所需的全部上下文。策略的选择取决于文档的性质和应用程序的需求。简单分块技术•固定大小分块最简单的方法将文本拆分为预定大小的分块如512个token。速度快、易于实现但可能会生硬地拆分句子。在分块之间设置重叠部分如50个token有助于缓解这一问题。•递归分块更智能的方法使用优先级分隔符列表如先段落、再句子、最后单词拆分文本。它尊重文档的自然结构是处理非结构化文本的可靠默认选择。•基于文档结构分块利用文档的固有结构进行分块。例如按Markdown文件的标题#、##、HTML文件的标签、或源代码的函数进行拆分。高级分块技术•语义分块不依赖分隔符而是根据含义拆分文本。将语义相关的句子分组仅当主题切换时才创建新分块生成高度连贯、独立的分块。•基于大型语言模型的分块利用大型语言模型智能处理文档生成语义连贯的分块。不依赖固定规则大型语言模型能够识别逻辑命题或总结章节创建保留含义的片段。•智能体分块在基于大型语言模型分块的基础上更进一步。人工智能智能体动态分析文档的结构和内容为特定文档选择最佳分块策略或策略组合。•层次化分块创建多个细节层级的分块如顶层摘要、中层章节和底层段落。这使检索系统能够从全局概述开始再根据需要深入到具体细节。•延迟分块一种颠覆标准流程的架构模式。先对整个文档进行嵌入生成包含完整上下文的token级嵌入向量然后再将文档拆分为分块每个分块的嵌入向量都源自这些预先计算的、富含上下文的token。预分块与后分块除了分块方式系统设计的一个关键选择是分块时机这决定了两种主要的架构模式预分块最常见的方法所有数据处理都在用户查询到来之前预先离线完成。•工作流程数据清洗→文档分块→嵌入并存储分块•优点查询时检索速度极快因为所有工作已提前完成系统只需执行快速的相似度搜索。•缺点分块策略固定。若决定更改分块大小或方法必须重新处理整个数据集。后分块一种先进的实时迭代方式分块在文档被检索后、响应用户查询时动态进行。•工作流程存储文档→检索相关文档→动态分块•优点灵活性极高。可根据用户查询的上下文制定动态分块策略可能获得更相关的结果。•缺点增加延迟。分块过程实时进行导致用户首次响应变慢且需要更复杂的基础设施进行管理。分块策略选择指南分块策略工作原理复杂度适用场景示例固定大小按token或字符数拆分。低小型或简单文档或对速度要求极高的场景。会议记录、短博客、电子邮件、简单常见问题解答递归反复拆分文本直至达到所需分块大小通常保留部分结构。中需要保留部分结构但仍注重速度的文档。研究论文、产品指南、短报告基于文档结构仅在文档边界或按标题等结构元素拆分。低由短独立文档或高度结构化文件组成的集合。新闻文章、客户支持工单、Markdown文件语义在自然含义边界主题、概念处拆分文本。中高主题切换无明确分隔符的技术、学术或叙事文档。科学论文、教科书、小说、白皮书基于大型语言模型利用语言模型根据上下文和含义决定分块边界。中高需基于含义分块以提升问答等下游任务性能的复杂文本。长报告、法律意见、医疗记录智能体由人工智能智能体根据含义和结构决定拆分方式。高需要自定义策略的复杂、细致文档。监管文件、多章节合同、公司政策延迟分块先对整个文档进行嵌入再从中衍生分块嵌入向量。高分块需了解文档完整上下文的场景。案例研究、综合手册、长篇分析报告层次化将文本拆分为多个层级章节→段落→句子。中既需要摘要又需要细节的大型结构化文档。员工手册、政府法规、软件文档总结检索增强系统的有效性并非取决于单一的“神奇”方法而是一系列深思熟虑的工程选择。提供给大型语言模型的上下文质量直接取决于两个关键决策1.分块策略如何做拆分文档的方法。2.架构模式何时做执行分块的时机。掌握这两个要素是上下文工程的基础。设计精良的检索系统是让大型语言模型从“猜测”走向提供基于事实、可靠且上下文相关答案的关键。提示词技术提示词工程是设计、优化输入提示词以获取期望输出的实践。大型语言模型的质量和性能很大程度上受其接收的提示词影响提示词的措辞方式直接决定响应的准确性、实用性和清晰度。本质上它是关于高效与人工智能交互的技术——通过提供指令、示例或问题引导模型生成所需输出。本节将介绍对提升检索增强生成RAG应用程序和大型语言模型整体性能至关重要的提示词技术。重要说明提示词工程关注如何为大型语言模型撰写指令而上下文工程则侧重于构建提供给模型的信息和知识如检索到的文档、用户历史或领域特定数据以最大限度地提高模型的理解能力和响应相关性。以下许多技术思维链、少样本提示、思维树、反应式提示与精心设计的上下文结合使用时效果最佳。经典提示词技术•思维链Chain of Thought要求模型“逐步思考”将复杂推理分解为中间步骤。当检索到的文档内容密集或包含需要仔细分析的冲突信息时这种方法特别有用。通过阐述推理过程大型语言模型能得出更准确、更符合逻辑的结论。•少样本提示Few-Shot Prompting在上下文窗口中为大型语言模型提供少量示例展示期望的输出类型或“标准答案”。提供示例有助于模型理解所需的格式、风格或推理方式尤其在专业或技术领域能提高响应的准确性和相关性。技巧1让模型的思维链推理与你的具体用例高度匹配。例如你可以要求模型•评估环境•重复所有相关信息•解释这些信息与当前请求的相关性技巧2让模型以“草稿”形式推理每句话不超过5个单词。这能确保模型的思维过程清晰可见同时减少输出token数量。将思维链和少样本示例结合使用能同时引导模型的推理过程和输出格式实现最高效率。高级提示词策略在经典技术的基础上高级策略以更复杂的方式引导大型语言模型•思维树Tree of Thoughts, ToT在思维链的基础上指示模型并行探索和评估多条推理路径类似决策树。模型可以生成多个解决方案然后选择最佳结果。在检索增强生成RAG中当存在多个潜在证据来源且模型需要根据多个检索到的文档权衡不同答案时这种方法特别有用。•反应式提示ReAct Prompting将思维链与智能体相结合使模型能够动态“推理”和“行动”。模型以交错方式生成推理轨迹和行动使其能够与外部工具或数据源交互并迭代调整推理过程。在检索增强生成RAG流水线中反应式提示能让大型语言模型实时与检索到的文档交互根据外部知识更新推理和行动从而提供更准确、更相关的响应。工具使用提示当大型语言模型与外部工具交互时清晰的提示词能确保工具的正确选择和使用。定义参数和执行条件大型语言模型有时会选择错误的工具或使用方式不佳。为避免这种情况提示词应明确定义•使用时机指定触发特定工具的场景或条件。•使用方法提供预期的输入、参数和期望的输出。•示例包含少量示例展示不同查询下工具的正确选择和使用。例如•用户查询“巴黎天气如何”→ 使用Weather_API参数city“Paris”•用户查询“帮我找埃菲尔铁塔附近的餐厅”→ 使用Restaurant_Search_Tool参数location“Eiffel Tower”这些精确的指导应作为工具描述的一部分帮助大型语言模型理解每个可用工具的确切边界和功能最大限度地减少错误提高系统整体可靠性。技巧如何撰写有效的工具描述大型语言模型是否使用你的工具完全取决于工具的描述。请务必注意以下几点•使用主动动词以清晰的动作开头。例如get_current_weather比weather_data更合适。•明确输入要求清楚说明工具所需的参数及其格式如city (string)、date (string, YYYY-MM-DD)。•描述输出结果告知模型预期的返回内容如返回包含“最高温度”“最低温度”和“天气状况”的JSON对象。•提及局限性若工具仅适用于特定地区或时间段需明确说明如注意仅适用于美国城市。提示词框架的使用如果你的项目需要大量提示词设计或希望系统地提升大型语言模型的结果可以考虑使用DSPy、Lama Prompt Ops、Synalinks等框架。不过你并非必须使用框架。遵循上述提示词指南清晰的指令、思维链、少样本学习和高级策略无需额外框架也能获得高效的结果。可以将这些框架视为复杂项目的可选辅助工具而非日常提示词工程的必需品。记忆构建智能体时记忆并非附加功能——而是赋予它们“生命力”的核心要素。没有记忆大型语言模型只是一个强大但无状态的文本处理器只能逐次响应查询毫无历史感可言。记忆将这些模型转变为更具动态性、甚至更“人性化”的系统能够保留上下文、从过去学习并灵活适应。安德里·卡帕西Andrej Karpathy曾做过一个贴切的比喻将大型语言模型的上下文窗口比作计算机的内存RAM将模型本身比作中央处理器CPU。在这个比喻中上下文窗口是智能体的“活跃意识”容纳着所有“工作思考”。但就像打开太多浏览器标签页的笔记本电脑一样这块内存很快就会被占满——每条消息、每个工具输出、每段信息都会消耗宝贵的token。这正是上下文工程的艺术所在。我们的目标不是向提示词中塞入更多数据而是设计出能充分利用活跃上下文窗口的系统——将关键信息留在可及范围内同时将其他信息巧妙地转移到更智能、更持久的存储中。上下文卸载是将信息存储在大型语言模型活跃上下文窗口之外的实践通常借助外部工具或向量数据库。这能释放有限的token空间确保只有最相关的信息留在上下文中。智能体记忆架构人工智能智能体的记忆旨在保留信息以应对不断变化的任务、记住成功或失败的经验并进行前瞻性思考。要构建稳健的智能体我们需要分层思考通常结合不同类型的记忆以达到最佳效果。短期记忆短期记忆是智能体的即时工作空间即“当下”——它被嵌入上下文窗口中为实时决策和推理提供支持。它通过上下文学习实现将近期对话、行动或数据直接纳入提示词。由于受模型token限制的约束短期记忆的核心挑战是效率。关键在于精简信息在不遗漏后续处理所需重要细节的前提下降低成本和延迟。长期记忆长期记忆超越了即时上下文窗口将信息存储在外部需要时可快速检索。这使智能体能够随着时间的推移逐步建立对自身环境和用户的持久理解。它通常通过检索增强生成RAG实现——智能体查询外部知识库如向量数据库以获取相关信息。长期记忆可存储多种类型的信息例如情景记忆用于存储特定事件或过去的交互语义记忆用于存储通用知识和事实。它还可以存储公司文档、产品手册或精选领域知识库中的信息使智能体能够提供准确的事实性答案。混合记忆架构实际上大多数现代系统采用混合方式将短期记忆的速度优势与长期记忆的深度优势相结合。一些先进架构甚至引入了额外的记忆层•工作记忆临时存储与特定多步骤任务相关的信息。例如当智能体负责预订旅行时其工作记忆会临时存储目的地、日期和预算直至任务完成而不会占用长期记忆空间。•程序记忆帮助智能体学习和掌握常规流程。通过观察成功的工作流程智能体可以内化重复任务的步骤序列随着时间的推移变得更快、更可靠。有效记忆管理的关键原则有效的记忆管理可能决定大型语言模型智能体的成败。糟糕的记忆实践会导致错误传播——检索到的错误信息会在后续任务中放大错误。以下是实现有效记忆管理的基本原则•精简和优化记忆记忆不是“写入即永久”的系统需要定期维护。定期扫描长期存储删除重复条目、合并相关信息或丢弃过时事实。一个简单的衡量标准是信息的时效性和检索频率如果一段记忆既陈旧又很少被访问尤其是在信息快速更新的环境中过时信息可能带来风险就可以考虑删除。例如客服智能体可以自动删除超过90天且标记为已解决、已关闭或不再活跃的对话记录仅保留摘要用于趋势检测和分析而非完整逐字记录。•选择性存储并非每次交互都值得永久存入长期记忆。必须实施某种过滤标准在保存前评估信息的质量和相关性。一段错误的检索信息往往会导致上下文污染使智能体反复犯同样的错误。一种预防方法是让大型语言模型在将交互信息存入记忆前进行“反思”并为其分配重要性评分。•根据任务定制架构不存在“万能”的记忆解决方案。客服机器人需要强大的情景记忆来回顾用户历史而分析财务报告的智能体则需要丰富的领域特定语义记忆。始终从最简单可行的方法入手如包含最近n次查询/响应的基础对话缓冲区并根据用例需求逐步添加更复杂的机制。•精通检索艺术有效的记忆不在于存储量而在于能否在合适的时间检索到合适的信息。简单的盲目搜索往往不够因此可以使用重排序利用大型语言模型重新排列检索结果以提高相关性和迭代检索通过多步骤优化/扩展搜索查询等高级技术来提升检索信息的质量。查询智能体和个性化智能体等工具内置了这些功能能够跨多个数据集搜索并根据用户偏好和交互历史进行重排序。归根结底记忆是大型语言模型智能体从“简单响应者”升级为“智能上下文感知系统”的关键。有效的记忆并非被动存储而是一个主动的管理过程我们的目标是构建不仅能存储记忆还能管理记忆的智能体——知道该记住什么、该忘记什么以及如何利用过去推理未来。工具如果说记忆赋予智能体“自我意识”那么工具就赋予了它们“超能力”。大型语言模型本身是出色的对话者和文本处理工具但它们却“与世隔绝”——无法查询实时天气、预订航班或查看实时股价。本质上它们与鲜活的数据和行动世界相脱节。这就是工具的价值所在。“工具”是任何能将大型语言模型智能体与外部世界连接起来的事物使其能够在现实世界中直接“行动”并检索完成任务所需的信息。整合工具能将智能体从“知识顾问”提升为“实干家”。工具的上下文工程不仅仅是为智能体提供一份应用程序接口API列表和使用说明更重要的是创建一个连贯的工作流程——让智能体了解可用工具、正确判断特定任务所需的工具并解读结果以推进任务。演进从提示词到行动现代工具使用的发展历程十分迅速。起初开发者尝试通过优秀的提示词工程让大型语言模型生成类似命令的文本这种方法虽然巧妙但容易出错。真正的突破是函数调用又称工具调用。如今大多数模型都原生支持这一功能允许大型语言模型输出结构化的JSON包含要调用的函数名称和所需参数。这一功能带来了诸多可能性•单一工具旅行智能体可以使用航班搜索工具当用户询问“帮我找下周二去东京的航班”时大型语言模型不会猜测答案而是生成你提供的函数调用指令进而查询真实的航空公司应用程序接口API。•工具链对于“帮我规划旧金山周末之旅”这样的复杂请求智能体可能需要串联多个工具航班搜索、酒店搜索和本地活动查询。这要求智能体具备推理、规划和执行多步骤工作流程的能力。工具的上下文工程核心在于如何呈现这些工具。一份优秀的工具描述就像一个微型提示词能清晰引导模型理解工具的功能、所需输入和返回结果。编排挑战给智能体配备工具并不难大多数情况下但要让它可靠、安全且高效地使用工具才是真正的难点。上下文工程的核心任务是“编排”——即当智能体判断使用哪种工具时管理信息流动和决策过程。这一过程涉及上下文窗口中的几个关键步骤。我们以基于Elysia编排框架构建的护肤领域知识应用Glowe为例拆解这些关键编排步骤1.工具发现智能体需要了解可用工具。这通常通过在系统提示词中提供可用工具列表及其描述来实现。这些描述的质量至关重要——它们是智能体理解每个工具功能的唯一指南帮助模型判断何时使用、更重要的是何时不使用某个工具。在Glowe中我们在初始化每个新对话树时都会配置一组带有精确描述的专用工具。2.工具选择与规划思考面对用户请求智能体必须判断是否需要使用工具。如果需要选择哪一个对于复杂任务甚至可能需要串联多个工具形成一个计划如“先通过网络查询天气再使用邮件工具发送摘要”。在这个案例中决策智能体正确分析了用户请求并选择了产品智能体工具。3.参数构建行动选择工具后智能体必须确定传递给工具的参数。例如若工具是get_weather(city, date)智能体需要从用户查询中提取“旧金山”和“明天”并将其格式化为正确的参数。这也可能是一个包含使用工具所需信息的结构化请求或应用程序接口API调用。在这个案例中产品智能体需要一个文本查询来搜索产品数据集。注意智能体在最初生成格式错误的参数导致错误后能够自我修正自我修复——这是编排的另一个关键环节。4.反思观察工具执行后其输出“观察结果”会被反馈到上下文窗口中。然后智能体反思该输出决定下一步行动工具使用是否成功是否生成了回答用户查询所需的信息或者返回了需要调整方法的错误可以看到编排通过这个强大的反馈循环通常称为“思考-行动-观察”循环实现。智能体观察行动结果并利用这些新信息推进下一次“思考”判断任务是否完成、是否需要使用其他工具或是否需要向用户请求澄清。这个“思考-行动-观察”循环构成了Elysia等现代智能体框架的基本推理循环。工具使用的下一个前沿工具使用的发展正朝着标准化方向迈进。虽然函数/工具调用效果良好但它创建了一个碎片化的生态系统——每个人工智能应用程序都需要与每个外部系统进行自定义集成。Anthropic于2024年末推出的模型上下文协议MCP解决了这一问题它提供了一个通用标准用于连接人工智能应用程序与外部数据源和工具。他们将其称为“人工智能的USB-C”——一种单一协议任何支持MCP的人工智能应用程序都可以通过它连接到任何MCP服务器。因此开发者无需为每个工具构建自定义集成只需创建单个MCP服务器通过这个标准化接口暴露其系统。任何支持MCP的人工智能应用程序都可以使用基于JSON-RPC的客户端-服务器通信协议轻松连接到这些服务器。这将原本的M×N集成问题M个应用程序每个都需要为N个工具编写自定义代码转化为更简单的MN问题。这种向可组合、标准化架构的转变框架使开发者能够通过模块化、可互操作的组件构建智能体代表了人工智能工具的未来。它将工程师的角色从编写自定义集成转变为编排自适应系统这些系统可以轻松连接到任何标准化外部系统。总结上下文工程不仅仅是提示词优化、检索系统构建或人工智能架构设计——它是构建能够在各种用途和用户场景中可靠运行的互联、动态系统的过程。本电子书描述的所有组件都将随着新技术、新模型和新发现的出现而不断演进但真正实用的系统与失败的人工智能应用之间的区别在于它们在整个架构中对上下文的工程设计水平。我们不再仅仅局限于向模型发送提示词而是开始构建模型赖以运行的“世界”。作为开发者、工程师和创造者我们深知最优秀的人工智能系统并非源于更大的模型而是源于更卓越的工程设计。如何学习AI大模型我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。1.AI大模型学习路线图2.100套AI大模型商业化落地方案3.100集大模型视频教程4.200本大模型PDF书籍5.LLM面试题合集6.AI产品经理资源合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

桐城市网站建设唯品会一家做特卖的网站

wordpress站点地图无法读取虚拟主机有几种类型

微网站建设报价广东省企业信用信息网

网站开发行业推广手机做无水印短视频网站

西安网站建设小程序开发免费凡科网站

怎么推广网站平台福州做网站哪家公司好

网站排名点击企业邮箱免费版注册