网站建设套餐报价网站开发如何学习

张小明 2026/1/2 20:34:41
网站建设套餐报价,网站开发如何学习,客户管理系统官网,乡镇网站建设中的问题提示学习#xff08;Prompt Learning#xff09;作为连接预训练语言模型#xff08;PLMs#xff09;与下游任务的桥梁#xff0c;有效弥合了预训练与微调之间的鸿沟。本文基于《提示学习研究综述》doi#xff1a;10.3778/j.issn.1002-8331.2407-0436 一文#xff0c;系统…提示学习Prompt Learning作为连接预训练语言模型PLMs与下游任务的桥梁有效弥合了预训练与微调之间的鸿沟。本文基于《提示学习研究综述》doi10.3778/j.issn.1002-8331.2407-0436一文系统梳理了提示学习的核心思想、两大关键步骤提示模板与语言表达器带您深入了解这一驱动大模型能力跃升的关键技术。一、提示学习弥合预训练与微调的鸿沟传统的“预训练-微调”Pre-train and Fine-tune范式虽然在自然语言处理NLP等领域取得了显著成就但其核心问题在于预训练任务如掩码语言建模MLM和下游微调任务之间存在巨大的数据和目标函数差距。这限制了预训练语言模型PLMs中通用知识向特定任务的有效迁移。提示学习的提出正是为了解决这一问题。它借鉴了迁移学习的思想通过设计有效的提示将下游任务转化为PLMs在预训练阶段更熟悉的完形填空任务形式。核心思想将提示模板插入到原始输入中将任务数据转化为自然语言形式输入PLMs模型输出预测结果后再通过语言表达器将输出映射到相应的标签。这种范式不仅缩小了差距还使得PLMs能够很好地应用于小样本Few-shot甚至零样本Zero-shot场景。图注传统范式a需要为每个下游任务微调模型提示学习范式b通过特定提示使PLMs适应多任务灵活性更高。想象一下你有一个超级学霸预训练语言模型PLM他读完了人类所有的书知识渊博。在传统范式“预训练-微调”PFT下我们要让学霸完成一个新任务比如判断一句话的情感需要给他看几千个标注好的例子然后微调他大脑里的所有知识结构让他专门去适应这个任务。这不仅耗时耗力而且如果新任务的数据太少学霸很容易“偏科”过拟合。而在提示学习Prompt Learning范式下它不改变学霸的大脑结构而是给他一个巧妙的提示让他用已有的知识来解决问题。以情感分析任务为例提示学习将其转化为完形填空任务图注 提示学习将“I like eating apples.”原始输入与“It was [MASK].”提示模板融合PLM预测[MASK]位置的词语言表达器将预测词如great映射到标签positive。补充示例任务判断“这杯咖啡太棒了”的情感。传统微调训练模型识别“太棒了”是正面情感。提示学习给模型一个提示“这杯咖啡太棒了。总的来说这是一种[MASK]的体验。”模型只需要像做完形填空一样填入“正面”或“积极”即可。提示学习的优势显而易见高效无需微调整个模型节省了巨大的计算资源。巧用充分利用了PLM在预训练阶段学到的通用知识。零/小样本在数据极度匮乏的情况下也能通过提示引导模型做出准确判断。二、提示学习的“两板斧”模板与表达器提示学习的实现就像设计一个精妙的“填空题”和“答案解析器”主要依赖于两大核心组件提示模板和语言表达器。图注 提示学习的整体框架分为基于提示模板的方法和基于语言表达器的方法两大类。1. 提示模板的构建如何“提问”提示模板是提示学习的“灵魂”它决定了模型如何理解任务。构建方法主要分为两大类提示模板构建方法核心思想关键技术通俗示例离散提示硬提示在离散的词汇空间中构建或搜索提示通常是自然语言文本。人工构建依赖领域专家知识如GPT-3、PET。自动构建通过算法搜索最佳的离散提示如AutoPrompt、LM-BFF。情感分析“这部电影太棒了。它让我感觉很[MASK]。”搜索最佳词汇算法自动找到比“感觉很”更有效的连接词。连续提示软提示在连续的嵌入空间中学习可优化的向量作为提示不直接对应自然语言词汇。Prefix-tuning只优化一个较小的、连续的、特定于任务的向量固定PLMs参数。Prompt-tuningPrefix-tuning的简化版学习连续提示来调整固定参数的LM。参数高效相当于在模型的输入层插入一段可训练的“暗号”只训练暗号不训练模型主体。引入外部知识将知识图谱、词典等外部知识融入提示构建增强提示的语义信息。KPT利用知识图谱中的实体关系信息来构建提示。思维提示X-of-Thought模拟人类的思考过程将复杂问题分解为多个简单步骤。思维链CoT通过中间推理步骤引导模型进行逻辑推理。思维链CoT“请一步一步思考然后给出答案。”1.1 人工构建提示模板Hard Prompting依赖领域专家知识手动设计提示通常是自然语言文本。NLP领域LAMA方法通过人工模板探索PLMs中的事实知识GPT-3使用人工提示适应生成任务PET方法利用人工模板将输入重述为完形填空式短语。CV和多模态领域****CLIP模型如图4所示通过人工构建文本提示如“A photo of a {object}.”将图像分类转化为图像-文本匹配问题实现零样本迁移。SAM模型如图5所示则通过提示编码器接收点、框、文本等提示信息实现通用图像分割。图注 CLIP通过文本编码器将提示文本转化为向量计算图像向量与文本向量的相似度实现零样本迁移。图注SAM模型通过提示编码器处理点、框、文本等提示信息与图像编码向量结合由掩码解码器输出有效掩码。1.2 自动构建提示模板旨在克服人工构建的耗时耗力及效果不佳的问题。离散提示在离散空间中自动搜索最佳提示。例如AutoPrompt使用基于梯度的搜索来确定最佳提示词LM-BFF使用T5模型自动创建提示模板。连续提示Soft Prompting采用可学习向量作为提示模板在连续嵌入空间中学习最优提示。Prefix-tuning如图6所示保持PLM参数固定只优化一个较小的、连续的、特定于任务的前缀向量适用于自然语言生成任务。Prompt-tuning可看作Prefix-tuning的简化只在输入层学习连续提示。CV领域****CoOp首次将连续提示应用于CV通过可学习向量对提示进行上下文建模CoCoOp引入输入-条件向量增强泛化能力VPT如图7所示在CV Transformer中只引入少量任务特定的可学习参数视觉提示保持主干参数不变。图注 传统微调上与Prefix-tuning下的对比Prefix-tuning实现了参数高效微调。图注 VPT在Transformer的输入端插入可学习的视觉提示Prompt仅优化提示参数实现CV领域的参数高效微调。1.3 引入外部知识构建提示将知识图谱、词典等外部知识融入提示构建增强提示的语义信息和准确性。例如KPT利用知识图谱中的实体关系信息来构建提示。1.4 思维提示X-of-Thought旨在增强模型的逻辑推理能力。思维链Chain-of-Thought, CoT是典型代表它通过构建思维推理提示将复杂的推理问题分解为多个简单的步骤模拟人类思考过程。2. 语言表达器的构建如何“解读”语言表达器负责将PLMs在完形填空任务中预测出的词汇如[MASK]位置的词映射回最终的任务标签如“正面”或“负面”。语言表达器构建方法核心思想关键技术通俗示例人工表达器专家手动定义标签词与标签的映射关系如将great映射为positive。简单直观但依赖人工经验且标签词选择可能影响性能。映射将模型填入的“积极”、“正面”、“棒极了”都映射为最终标签“正面”。基于搜索的表达器通过搜索算法在词汇表中寻找最佳的标签词集合。PET在训练过程中搜索最佳的标签词。优化映射算法发现“令人愉悦”比“好”更能准确代表“正面”标签。软表达器学习一个可训练的矩阵将模型输出的词汇嵌入空间映射到标签空间。Soft Verbalizer避免了对离散标签词的依赖直接在连续空间进行映射。自动匹配机器自动学习“正面”和“积极”在向量空间中的相似性并将其归为一类。引入外部知识利用外部知识如词典、知识图谱来辅助标签词的选择和映射。KPT利用知识图谱信息来增强标签词的选择。三、提示学习的应用提示学习已广泛应用于NLP、CV和多模态等多个领域。领域典型任务关键模型/方法NLP情感分析、文本分类、关系抽取、自然语言推理PET、LM-BFF、CoTCV图像分类、视频动作识别、视觉定位CLIP、CoOp、VPT、SAM多模态视觉问答、多模态机器翻译、多模态情感分析CLIP、CPT、VL-T51. 计算机视觉CV领域的应用在CV领域提示学习主要用于将视觉任务转化为模型更熟悉的“文本-图像”匹配任务实现零样本迁移。关键模型核心思想提示形式应用场景CLIP将图像分类任务转化为“图像-文本”匹配。通过人工构建文本提示如“A photo of a {class}.”计算图像特征与提示文本特征的相似度进行分类。人工离散提示零样本图像分类CoOp/CoCoOp针对CLIP中人工提示的局限性引入可学习的连续向量作为提示提升模型适应性。连续提示图像识别VPT (Visual Prompt Tuning)在Transformer主干参数固定的情况下只在输入空间引入少量任务特定的可学习参数视觉提示。连续提示图像识别、目标检测SAM (Segment Anything Model)这是一个通用的图像分割模型通过提示编码器接收点、框、文本等提示信息实现交互式分割。多模态提示图像分割2. 多模态领域的应用提示学习在多模态任务中如视觉问答、多模态情感分析等通过设计跨模态提示促进不同模态信息如图像和文本的融合与理解。例如**CPTCross-modal Prompt Tuning**方法首次将视觉定位任务表述为完形填空问题通过视觉和文本提示来引导模型建立查询文本和图像之间的联系。四、挑战与展望提示学习虽然取得了巨大的成功但仍面临着诸多挑战同时也预示着未来的发展方向。1. 现有挑战提示理解与设计提示模板的微小变化可能导致模型性能的巨大波动如何设计出鲁棒性强的提示仍是难题。知识迁移与泛化如何确保提示学习在面对新的、未知的领域时具有更强的领域泛化能力。多模态应用如何设计更有效的跨模态提示以实现不同模态信息的深度融合和理解。2. 未来展望通用化与自动化发展更加通用的提示学习框架实现提示模板和语言表达器的全自动、自适应生成减少对人工经验的依赖。提示与推理的结合进一步探索思维链CoT等方法增强模型的逻辑推理和复杂问题解决能力。提示驱动的知识蒸馏利用提示学习将大模型的知识高效地迁移到小模型中实现模型轻量化。提示与强化学习的结合利用强化学习来优化提示的生成过程以获得更有效的提示。总结提示学习是预训练模型发展史上的一个重要里程碑它以一种更自然、更高效的方式释放了PLMs蕴含的巨大潜力。随着技术的不断演进提示学习必将成为推动人工智能迈向更通用、更智能未来的核心驱动力之一。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

哪些品牌网站做的好深圳短视频seo搜索排名如何做

还在为无法下载流媒体加密视频而烦恼吗?Video Decrypter这款专业的视频处理工具,专门针对MPEG-DASH Widevine DRM加密视频进行处理和下载。无论您是想保存珍贵视频内容,还是需要离线观看流媒体,这款开源工具都能让您轻松应对DRM保…

张小明 2025/12/28 16:47:13 网站建设

北京网站制作培训学校网站色彩搭配

如何利用GPT-SoVITS打造专属语音助手?完整教程来了 在智能设备无处不在的今天,我们早已习惯了Siri、小爱同学或Alexa那略显机械的声音。但你有没有想过——如果语音助手能用你自己的声音说话,甚至模仿你最爱的家人、偶像或角色发声&#xff0…

张小明 2025/12/28 16:46:40 网站建设

注册个网站域名多少钱网站推广的宣传途径

文章目录一、 链表的基本操作创建英雄节点类创建英雄节点类插入节点通过姓名查看熟练度通过姓名删除信息通过姓名修改英雄稀有度将链表保存到文件从文件中读出信息并以链表形式储存说说你理解的大小端,现代电脑一般是大端存储还是小端存储?文件操作中“流…

张小明 2026/1/1 3:01:49 网站建设

网站建设网页设计公司网站开发做网站

小红书视频下载神器:3分钟搞定无水印批量下载全攻略 【免费下载链接】XHS-Downloader 免费;轻量;开源,基于 AIOHTTP 模块实现的小红书图文/视频作品采集工具 项目地址: https://gitcode.com/gh_mirrors/xh/XHS-Downloader …

张小明 2026/1/2 3:31:15 网站建设

网站中怎么做视频直播网站前期策划

Windows设备驱动开发与Thunk技术详解 1. Windows驱动DLL与DPMI服务 DPMI(DOS Protected Mode Interface)服务使得Windows驱动DLL能够与DOS TSRs(Terminate and Stay Resident)和设备驱动进行通信。若已有DOS驱动,将其修改为支持Windows的版本可能是最短的开发路径。若从头…

张小明 2025/12/29 18:17:21 网站建设

株洲网站制作与设计联通屏蔽wordpress

Cyberdrop和Bunkr批量下载器:告别手动点击的终极方案 【免费下载链接】CyberdropBunkrDownloader Simple downloader for cyberdrop.me and bunkrr.sk 项目地址: https://gitcode.com/gh_mirrors/cy/CyberdropBunkrDownloader 你是否曾经面对一个包含数百个文…

张小明 2025/12/30 7:48:36 网站建设