外贸销售网站建设佛山企业网站自助建站

张小明 2026/1/2 5:43:20
外贸销售网站建设,佛山企业网站自助建站,沧州网站建设推广,线上推广营销在之前的文章 嵌入和语义检索 中#xff0c;我们了解了把文本变成向量的方法#xff0c;由于这些向量相当于将文本做了分类#xff1a;语义相近的距离越近#xff0c;所以这些向量就可以很方便的应用于语义检索场景了。 比较向量相似度#xff08;vector similarity…在之前的文章 嵌入和语义检索 中我们了解了把文本变成向量的方法由于这些向量相当于将文本做了分类语义相近的距离越近所以这些向量就可以很方便的应用于语义检索场景了。比较向量相似度vector similarity的常见算法主要分为两大类1️⃣基于“角度/方向”的度量2️⃣基于“距离/差异”的度量下面我们系统的整理一下。一、基于“方向”的相似度算法常用于语义相似度这些方法关注向量间的夹角或方向一致性而不太关心长度。1.余弦相似度Cosine Similarity公式cosine-sim ( A , B ) A ⋅ B ∣ ∣ A ∣ ∣ , ∣ ∣ B ∣ ∣ \text{cosine-sim}(A, B) \frac{A \cdot B}{||A|| , ||B||}cosine-sim(A,B)∣∣A∣∣,∣∣B∣∣A⋅B​值域[-1, 1]越接近 1表示两个向量方向越相似。特点忽略向量的大小只看“方向”是否一致。应用文本嵌入、语义搜索、推荐系统例如BERT、Word2Vec后常用。2.点积Dot Product公式A ⋅ B ∑ i A i B i A \cdot B \sum_i A_i B_iA⋅Bi∑​Ai​Bi​几何意义点积的几何意义本质是将一个向量投影到另一个向量上再计算投影长度与被投影向量长度的乘积它直接关联向量的方向关系。点积的另一个计算公式为A ⃗ ⋅ B ⃗ ∣ A ⃗ ∣ ⋅ ∣ B ⃗ ∣ ⋅ cos ⁡ θ \vec{A} \cdot \vec{B} |\vec{A}| \cdot |\vec{B}| \cdot \cos\thetaA⋅B∣A∣⋅∣B∣⋅cosθ其中θ \thetaθ是两个向量的夹角这个公式直接体现了其几何意义可拆解为两步计算向量B ⃗ \vec{B}B在向量A ⃗ \vec{A}A方向上的投影长度即∣ B ⃗ ∣ ⋅ cos ⁡ θ |\vec{B}| \cdot \cos\theta∣B∣⋅cosθ将这个投影长度与向量A ⃗ \vec{A}A的自身长度∣ A ⃗ ∣ |\vec{A}|∣A∣相乘得到点积结果。反过来也可以理解为向量A ⃗ \vec{A}A在B ⃗ \vec{B}B方向上的投影长度乘以∣ B ⃗ ∣ |\vec{B}|∣B∣结果完全相同。数学真是太神奇了使用不同的方法计算正确结果只有一个。点积衍生意义判断向量方向关系点积的正负和大小能直接反映两个向量的方向关联这是其几何意义的重要应用A ⃗ ⋅ B ⃗ 0 \vec{A} \cdot \vec{B} 0A⋅B0cos ⁡ θ 0 \cos\theta 0cosθ0夹角θ 9 0 ∘ \theta 90^\circθ90∘两个向量方向大致相同锐角或同向A ⃗ ⋅ B ⃗ 0 \vec{A} \cdot \vec{B} 0A⋅B0cos ⁡ θ 0 \cos\theta 0cosθ0夹角θ 9 0 ∘ \theta 90^\circθ90∘两个向量垂直正交A ⃗ ⋅ B ⃗ 0 \vec{A} \cdot \vec{B} 0A⋅B0cos ⁡ θ 0 \cos\theta 0cosθ0夹角θ 9 0 ∘ \theta 90^\circθ90∘两个向量方向大致相反钝角或反向。特点向量越长、方向越相近点积越大。若向量已归一化则点积 余弦相似度。应用在神经网络、注意力机制attention score中常用。3.皮尔逊相关系数Pearson Correlation公式r ( A , B ) ∑ i ( A i − A ˉ ) ( B i − B ˉ ) ∑ i ( A i − A ˉ ) 2 ∑ i ( B i − B ˉ ) 2 r(A, B) \frac{\sum_i (A_i - \bar{A})(B_i - \bar{B})}{\sqrt{\sum_i (A_i - \bar{A})^2} \sqrt{\sum_i (B_i - \bar{B})^2}}r(A,B)∑i​(Ai​−Aˉ)2​∑i​(Bi​−Bˉ)2​∑i​(Ai​−Aˉ)(Bi​−Bˉ)​特点衡量线性相关性与余弦相似度相似但会去除平均值影响。应用用户行为相似度、推荐系统协同过滤。二、基于“距离”的相似度算法越小越相似这些算法测量两个向量的“距离”常用于数值特征。4.欧氏距离Euclidean Distance公式d ( A , B ) ∑ i ( A i − B i ) 2 d(A, B) \sqrt{\sum_i (A_i - B_i)^2}d(A,B)i∑​(Ai​−Bi​)2​几何意义欧氏距离的几何意义本质是n维空间中两个点之间的“直线距离”是平面几何中两点间距离公式在高维空间的直接推广。从二维到高维的直观理解:欧氏距离的核心是“直线最短”在不同维度空间中表现为具体的直线距离二维空间平面上两点( x 1 , y 1 ) (x_1,y_1)(x1​,y1​)和( x 2 , y 2 ) (x_2,y_2)(x2​,y2​)之间的直线距离公式为( x 2 − x 1 ) 2 ( y 2 − y 1 ) 2 \sqrt{(x_2-x_1)^2 (y_2-y_1)^2}(x2​−x1​)2(y2​−y1​)2​对应勾股定理中斜边的长度。欧氏距离三维空间立体空间中两点( x 1 , y 1 , z 1 ) (x_1,y_1,z_1)(x1​,y1​,z1​)和( x 2 , y 2 , z 2 ) (x_2,y_2,z_2)(x2​,y2​,z2​)之间的直线距离公式扩展为( x 2 − x 1 ) 2 ( y 2 − y 1 ) 2 ( z 2 − z 1 ) 2 \sqrt{(x_2-x_1)^2 (y_2-y_1)^2 (z_2-z_1)^2}(x2​−x1​)2(y2​−y1​)2(z2​−z1​)2​。n维空间对于抽象的n维数据点如机器学习中的特征向量欧氏距离同样表示两点沿各维度坐标差值构成的“超空间直线长度”公式为∑ i 1 n ( x i 2 − x i 1 ) 2 \sqrt{\sum_{i1}^n (x_{i2}-x_{i1})^2}∑i1n​(xi2​−xi1​)2​。特点直观、最常见。距离越小越相似如两个用户的偏好特征、两个样本的属性。应用聚类KMeans、图像向量检索。5.曼哈顿距离Manhattan Distance公式d ( A , B ) ∑ i ∣ A i − B i ∣ d(A, B) \sum_i |A_i - B_i|d(A,B)i∑​∣Ai​−Bi​∣特点对异常值更鲁棒适合稀疏向量。应用特征稀疏的场景如词袋模型。6.闵可夫斯基距离Minkowski Distance公式d ( A , B ) ( ∑ i ∣ A i − B i ∣ p ) 1 / p d(A, B) \left( \sum_i |A_i - B_i|^p \right)^{1/p}d(A,B)(i∑​∣Ai​−Bi​∣p)1/p特点欧氏距离p2和曼哈顿距离p1的泛化形式。7.切比雪夫距离Chebyshev Distance公式d ( A , B ) max ⁡ i ∣ A i − B i ∣ d(A, B) \max_i |A_i - B_i|d(A,B)imax​∣Ai​−Bi​∣特点只关心最大差异的维度。实际应用推荐应用场景推荐算法文本语义相似度余弦相似度、欧氏距离、点积图像特征匹配欧氏距离、余弦相似度用户行为相似度皮尔逊相关系数稀疏特征向量曼哈顿距离总结在语义检索semantic retrieval领域最常用的相似度比较算法是余弦相似度使用最广泛、最经典的语义相似度算法、欧氏距离、点积。在语义检索系统如基于 BERT / BGE / SimCSE / OpenAI Embedding的实现里算法常见用途备注余弦相似度文本语义检索、RAG系统默认标准欧氏距离向量数据库内部优化距离越小越相似点积相似度注意力机制、嵌入匹配速度快常见于模型内部感谢观看祝好运
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网站建设要做哪些工作vs html5网站开发

LobeChat国际化支持现状:多语言界面切换实操 在当今全球协作日益紧密的背景下,AI聊天应用早已不再局限于单一语言用户。无论是跨国企业的内部助手,还是面向公众的智能客服平台,能否流畅支持中文、英文、日语甚至阿拉伯语&#xff…

张小明 2025/12/29 1:07:27 网站建设

wordpress搭建外贸网站域名被墙检测网站

10 个 AI 工具推荐 适配基于 Java 的毕业论文复现与写作10 个 AI 工具推荐:适配基于 Java 的毕业论文复现与写作在开始详细介绍之前,先为大家总结10个推荐AI工具的核心对比。以下表格简明扼要地对比了这些工具的主要优势、处理时间和适配平台&#xff0c…

张小明 2025/12/29 1:06:53 网站建设

怎么做的英文网站professional wordpress

QMCDecode完全攻略:轻松解密QQ音乐加密文件 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转换结果存储…

张小明 2025/12/29 1:06:18 网站建设

怎么用mvc架构做网站界面设计最好的网站

第一章:Open-AutoGLM性能优化概述Open-AutoGLM作为一款面向自动化生成语言任务的开源大模型框架,其性能表现直接影响推理效率与部署成本。在实际应用场景中,模型的响应延迟、吞吐量以及资源占用率是关键评估指标。为此,性能优化成…

张小明 2025/12/30 4:59:23 网站建设

如何自己做网站知识人人做全免费网站

日期和时间的格式化、解析及时间区域的使用 1. 日期和时间的格式化与解析 1.1 不同地区的日期格式差异 日期的格式会因地区而异。例如,2002 年 5 月 9 日,在美国英语(en - US)地区的短格式为 5/9/02,而在法国法语(fr - FR)地区则为 09/05/02。 1.2 JSTL 的日期格式化…

张小明 2025/12/31 12:02:47 网站建设

购物网站前台模板自助网站建设哪家优惠

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个AI辅助的代码编辑器,支持自动补全Cursor操作相关的代码片段。功能包括:1. 根据上下文智能提示Cursor操作(如移动、选择、删除等&#xf…

张小明 2025/12/30 3:40:26 网站建设