AI 模型库
all-MiniLM-L6-v2
sentence-similarityall-MiniLM-L6-v2 这是一个句子变换器模型:它将句子和段落映射到384维的稠密向量空间,可用于聚类或语义搜索等任务。
paraphrase-multilingual-MiniLM-L12-v2
sentence-similaritysentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
all-mpnet-base-v2
sentence-similarityall-mpnet-base-v2 这是一个句子变换器模型:它将句子和段落映射到768维的稠密向量空间,可用于聚类或语义搜索等任务。
bge-m3
sentence-similarity更多详情请参考我们的GitHub仓库:https://github.com/FlagOpen/FlagEmbedding
nomic-embed-text-v1.5
sentence-similaritynomic-embed-text-v1.5:基于套娃表示学习的可伸缩生产级嵌入模型
multilingual-e5-small
sentence-similarity多语言E5文本嵌入:技术报告。 王亮、杨楠、黄小龙、杨林军、Rangan Majumder、韦福如,arXiv 2024
nomic-embed-text-v1
sentence-similaritynomic-embed-text-v1:一种可复现的长上下文(8192)文本嵌入器
paraphrase-multilingual-mpnet-base-v2
sentence-similaritysentence-transformers/paraphrase-multilingual-mpnet-base-v2
multilingual-e5-base
sentence-similarity多语言E5文本嵌入:技术报告。 王亮,杨楠,黄小龙,杨林军,Rangan Majumder,韦福如,arXiv 2024
paraphrase-MiniLM-L6-v2
sentence-similarity这是一个sentence-transformers模型:它将句子和段落映射到384维的稠密向量空间,可用于聚类或语义搜索等任务。
all-MiniLM-L12-v2
sentence-similarityall-MiniLM-L12-v2 这是一个sentence-transformers模型:它将句子和段落映射到384维的稠密向量空间,可用于聚类或语义搜索等任务。
finance-embeddings-investopedia
sentence-similarity这是FinLang团队为金融应用开发的Investopedia嵌入模型。该模型使用我们开源的金融数据集进行训练,数据集来自https://huggingface.co/datasets/FinLang/investopedia-embedding-dataset
multi-qa-mpnet-base-dot-v1
sentence-similaritymulti-qa-mpnet-base-dot-v1 这是一个句子变换器模型:它将句子和段落映射到768维的稠密向量空间,专为**语义搜索**设计。该模型基于来自不同来源的2.15亿个(问题,答案)对进行训练。如需了解语义搜索的入门介绍,请参阅
e5-large
sentence-similarity**新闻(2023年5月):请切换至e5-large-v2,该版本性能更优且使用方法相同。**
all-distilroberta-v1
sentence-similarityall-distilroberta-v1 这是一个句子变换器模型:它将句子和段落映射到768维的稠密向量空间,可用于聚类或语义搜索等任务。
Qwen3-VL-Embedding-2B
sentence-similarityThe **Qwen3-VL-Embedding** and **Qwen3-VL-Reranker** model series are the latest additions to the Qwen family, built upon the recently open-sourced and powerful Qwen3-VL foundation model. Specifically
gte-multilingual-base
sentence-similarity**gte-multilingual-base** 模型是 GTE(通用文本嵌入)模型系列中的最新成员,具备以下关键特性:
e5-base-v2
sentence-similarity弱监督对比预训练的文本嵌入。 梁旺、杨楠、黄晓龙、焦斌星、杨林军、江大新、Rangan Majumder、韦福如,arXiv 2022