湖南省网站开网站建设需要办什么手续

张小明 2026/1/10 10:03:00
湖南省网站,开网站建设需要办什么手续,莱西网站建设,郑州小程序开发制作公司作者#xff1a;来自 Elastic JINA 新的 0.6B - parameter 的 listwise reranker #xff0c;在单个 context window 中同时考虑 query 和所有 candidate documents 。 我们很高兴发布 jina-reranker-v3 #xff0c;这是我们最新一代的 reranker #xff0c;在多语言检索基…作者来自 Elastic JINA新的 0.6B - parameter 的 listwise reranker 在单个 context window 中同时考虑 query 和所有 candidate documents 。我们很高兴发布 jina-reranker-v3 这是我们最新一代的 reranker 在多语言检索基准上提供最先进的性能。这个 0.6B - parameter 的 document reranker 引入了一种新的 last but not late interaction最后但不迟的交互 与现有方法采取了根本不同的方式。 jina-reranker-v3 以listwise方式工作它在单个 context window 内对 query 和所有 candidate documents 应用 causal attention 在从每个 document 的 final token 提取 contextual embeddings 之前实现丰富的跨 document 交互。我们的新模型在 BEIR 上达到了 61.94 nDCG10 性能超过 Qwen3-Reranker-4B 同时模型体积小 6× 。ModelSizeBEIRMIRACLMKQACoIRjina-reranker-v30.6B61.9466.8367.9270.64jina-reranker-v20.3B57.0663.6567.9056.14jina-reranker-m02.4B58.9566.7568.1963.55bge-reranker-v2-m30.6B56.5169.3267.8836.28mxbai-rerank-base-v20.5B58.4055.3264.2465.71mxbai-rerank-large-v21.5B61.4457.9467.0670.87Qwen3-Reranker-0.6B0.6B56.2857.7065.3465.18Qwen3-Reranker-4B4.0B61.1667.5267.5273.91jina-code-embeddings-0.5b0.5B---73.94模型架构jina-reranker-v3 构建在 Qwen3-0.6B backbone 上这是一个仅 decoder 的 transformer 模型带有 causal self-attention。该模型同时处理多个 documents 和 query在指定的 token 位置提取 contextual embeddings以实现高效的相似度计算。ParameterValueTotal Parameters0.6BNon-Embedding Parameters0.44BHidden Size1,024Number of Layers28Attention Heads (Q/KV)16/8 (GQA)Context Length131,072MLP Projector1024→512→256Final Embedding Size256给定一个 query 和一组 candidate documents jina-reranker-v3 使用一个专门的 prompt template 处理 reranking 任务该模板在单次 forward pass 中实现跨 document 交互。输入构建遵循特定格式|im_start|system You are a search relevance expert who can determine a ranking of passages based on their relevance to the query. |im_end| |im_start|user I will provide you with k passages, each indicated by a numerical identifier. Rank the passages based on their relevance to query: [QUERY] passage id1 [DOCUMENT_1]|doc_emb| /passage passage id2 [DOCUMENT_2]|doc_emb| /passage ... passage idk [DOCUMENT_k]|doc_emb| /passage query [QUERY]|query_emb| /query |im_end| |im_start|assistant think/think在输入结构中query 出现两次—— 一次在开头用于任务指令一次在末尾用于最终 attention 处理。这种双重位置使得最终的 query 位置可以通过 causal attention 关注所有前面的 documents。两个关键的特殊 token 标记了 embedding 提取位置|doc_emb| token 放在每个 document 之后用于标记 document embedding 的提取点而 |query_emb| token 放在最终的 query 之后用于标记 query embedding 的提取点。这些 embeddings 通过共享的 causal self-attention 机制捕捉了局部 document 语义和全局跨 document 上下文。我们称这种 query-document 交互为 “last but not late”。之所以叫 “last”是因为 |doc_emb| 放在每个 document 的最后一个 token。之所以叫 “not late”是因为与 ColBERT 等 late interaction 模型不同那些模型在多向量匹配前会单独编码 documents而我们在 forward pass 中在同一个 context window 内实现了 query-document 和 document-document 交互。最后一个带 ReLU 激活的两层 MLP projector 将 1024 维的 hidden states 映射到 256 维的 ranking space。相关性评分通过投影后的 query embedding 与每个投影后的 document embedding 之间的 cosine similarity 计算从而为输入集合中的每个 document 生成相关性分数。入门通过 API使用 jina-reranker-v3 最简单的方法是通过我们的 Search Foundation API 。我们可以参考之前的文章 “Jina-VLM小型多语言视觉语言模型” 来获取一个 API key。然后我们使用如下的命令来定义一个环境变量export JINA_API_KEYYour JIAN API KEYcurl -X POST \ https://api.jina.ai/v1/rerank \ -H Content-Type: application/json \ -H Authorization: Bearer JINA_API_KEY \ -d { model: jina-reranker-v3, query: slm markdown, documents: [ ... ], return_documents: false }比如curl -X POST \ https://api.jina.ai/v1/rerank \ -H Content-Type: application/json \ -H Authorization: Bearer $JINA_API_KEY \ -d { model: jina-reranker-v3, query: 阿里巴巴中国有限公司是哪一年成立的, documents: [ 阿里巴巴是全球领先的B2B电子商务网上贸易平台, 阿里巴巴中国有限公司成立于2007年03月26日法定代表人蒋芳 ], return_documents: false } | jq .$ curl -X POST \ https://api.jina.ai/v1/rerank \ -H Content-Type: application/json \ -H Authorization: Bearer $JINA_API_KEY \ -d { model: jina-reranker-v3, query: 阿里巴巴中国有限公司是哪一年成立的, documents: [ 阿里巴巴是全球领先的B2B电子商务网上贸易平台, 阿里巴巴中国有限公司成立于2007年03月26日法定代表人蒋芳 ], return_documents: false } | jq . % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 494 100 168 100 326 194 377 --:--:-- --:--:-- --:--:-- 571 { model: jina-reranker-v3, object: list, usage: { total_tokens: 218 }, results: [ { index: 1, relevance_score: 0.55301309 }, { index: 0, relevance_score: -0.05146404 } ] }很显然文档 index 为 1 的文档和 “阿里巴巴中国有限公司是哪一年成立的” 更为贴近。通过 transformersfrom transformers import AutoModel model AutoModel.from_pretrained( jinaai/jina-reranker-v3, dtypeauto, trust_remote_codeTrue, ) model.eval()现在你可以使用模型的 rerank 函数来计算 query 和一组 documents 的相关性分数query What are the health benefits of green tea? documents [ Green tea contains antioxidants called catechins that may help reduce inflammation and protect cells from damage., El precio del café ha aumentado un 20% este año debido a problemas en la cadena de suministro., Studies show that drinking green tea regularly can improve brain function and boost metabolism., Basketball is one of the most popular sports in the United States., 绿茶富含儿茶素等抗氧化剂可以降低心脏病风险还有助于控制体重。, Le thé vert est riche en antioxydants et peut améliorer la fonction cérébrale., ] # Rerank documents results model.rerank(query, documents) # Results are sorted by relevance score (highest first) for result in results: print(fScore: {result[relevance_score]:.4f}) print(fDocument: {result[document][:100]}...) print()完整的代码transformer.py$ python transformer.py modeling.py: 10.4kB [00:00, 11.6MB/s] A new version of the following files was downloaded from https://huggingface.co/jinaai/jina-reranker-v3: - modeling.py . Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision. model.safetensors: 100%|█████████████████████████████████████████████████████████| 1.19G/1.19G [00:5400:00, 21.8MB/s] generation_config.json: 100%|████████████████████████████████████████████████████████| 202/202 [00:0000:00, 1.46MB/s] tokenizer_config.json: 10.7kB [00:00, 17.9MB/s] tokenizer.json: 100%|████████████████████████████████████████████████████████████| 11.4M/11.4M [00:0400:00, 2.41MB/s] added_tokens.json: 100%|█████████████████████████████████████████████████████████████| 795/795 [00:0000:00, 6.74MB/s] special_tokens_map.json: 100%|███████████████████████████████████████████████████████| 777/777 [00:0000:00, 2.29MB/s] Score: 0.2966 Document: Green tea contains antioxidants called catechins that may help reduce inflammation and protect cells... Score: 0.2262 Document: 绿茶富含儿茶素等抗氧化剂可以降低心脏病风险还有助于控制体重。... Score: 0.1911 Document: Studies show that drinking green tea regularly can improve brain function and boost metabolism.... Score: 0.1645 Document: Le thé vert est riche en antioxydants et peut améliorer la fonction cérébrale.... Score: -0.1602 Document: El precio del café ha aumentado un 20% este año debido a problemas en la cadena de suministro.... Score: -0.1699 Document: Basketball is one of the most popular sports in the United States....结论jina-reranker-v3 是一个新的 0.6B parameter 多语言 listwise reranker引入了 last but not late interaction以实现高效的 document reranking。Documents 在编码过程中可以互相关注建立交互从而影响最终排序。一个主要关注点是这种交互是否对输入顺序的变化具有鲁棒性——也就是说如果我们打乱输入顺序排名是否保持不变我们用一个 query 对 110 个 candidate documents 进行了随机排列测试并在下图中绘制了每个排名位置的方差。关键发现是排名靠前的位置表现出极好的稳定性。排名 1-10 的方差最小最相关的 documents 无论输入顺序如何都能稳定排在顶部。这对于 nDCG10 和类似的 top-k 指标至关重要。无关的 documents 一直排在底部清晰区分了相关内容和无关内容。中间部分显示了明显的位置交换这是预期且可接受的。模型使用 causal self-attention并根据序列中前面的内容编码不同的上下文信息。在实际应用中我们关心的是最顶部的结果这种行为完全可以接受。我们的评估显示 jina-reranker-v3 的性能优于早期版本包括 jina-reranker-v2-base-multilingual 和 jina-colbert-v2以及更大的替代模型如 Qwen3-Reranker-4B 和 jina-reranker-m0 进一步证实了这一点。原文https://jina.ai/news/jina-reranker-v3-0-6b-listwise-reranker-for-sota-multilingual-retrieval/
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

青岛网站推广优化合肥网站建设正规公司

Git克隆TensorRT仓库时 submodule 初始化方法 在深度学习模型部署的实际工程中,一个看似简单的操作——git clone,却常常成为开发者“卡住”的第一道门槛。尤其是当目标项目如 NVIDIA 的 TensorRT 采用复杂的 submodule 结构时,若不加以注意&…

张小明 2026/1/9 17:19:05 网站建设

公司的官方网站怎么做iis中的网站启动不了

对比学习框架的工业级实现:基于 TensorFlow 的完整实践 在计算机视觉领域,一个日益突出的问题是——如何在缺乏大量标注数据的情况下,依然训练出高性能的模型?尤其是在医疗影像、工业质检等专业场景中,获取高质量标签的…

张小明 2026/1/9 17:19:06 网站建设

本地怎么做网站服务器吗注册公司需要怎么注册

第一章:性能测试工具对比的背景与意义在现代软件系统日益复杂的背景下,性能测试已成为保障应用稳定性与用户体验的关键环节。随着微服务架构、云原生技术的普及,系统并发能力、响应延迟和资源消耗等指标直接影响业务连续性。选择合适的性能测…

张小明 2026/1/9 17:19:07 网站建设

网站转换小程序适合个人开网店的平台

资源下载器终极教程:5分钟掌握网页资源嗅探技巧 【免费下载链接】res-downloader 资源下载器、网络资源嗅探,支持微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载! 项目地址: https://gitcode.com/GitHu…

张小明 2026/1/9 0:08:20 网站建设

怎么在电脑上建立自己的网站广告平台源码

学霸同款10个AI论文写作软件,助你搞定研究生论文难题! AI 工具如何帮你轻松应对论文写作难题 在研究生阶段,论文写作是每位学生必须面对的挑战。从选题到开题、从初稿到修改,每一步都充满了压力与不确定性。而随着 AI 技术的发展&…

张小明 2026/1/9 17:19:06 网站建设

网站编程图提供网页制作平台的公司

对于软件测试从业者而言,我们每天都在生产海量数据:用例执行数、通过率、缺陷数量、严重等级分布、模块缺陷密度、回归测试周期……这些数据是软件质量最客观的反映。然而,如何将这些“数据金矿”转化为团队、项目经理乃至客户都能瞬间理解的…

张小明 2026/1/10 9:44:34 网站建设