bge-small-zh-v1.5

BAAI feature-extraction transformers zh

BAAI/bge-small-zh-v1.5

2,539,200

下载量

113

收藏数

31

浏览量

mit

许可

简介

模型卡片

许可协议 mit

语言

zh

模型配置

模型类型 bert

架构 BertModel

模型详情

已翻译

FlagEmbedding

    模型列表 | 
    常见问题 |
    使用方法  |
    评估 |
    训练 |
    联系我们 |
    引用 |
    许可证

更多详情请参阅我们的 Github：FlagEmbedding。

英文 | 中文

FlagEmbedding 可以将任意文本映射为低维稠密向量，用于检索、分类、聚类或语义搜索等任务。
它也可用于大语言模型的向量数据库。

*** 🌟更新🌟 **
- 2023年10月12日：发布 LLM-Embedder，一个统一的 embedding 模型，支持大语言模型多样化的检索增强需求。论文 :fire:
- 2023年9月15日：BGE 的技术报告已发布
- 2023年9月15日：BGE 的大规模训练数据已发布
- 2023年9月12日：新模型：
- *新的 reranker 模型：发布交叉编码器模型 BAAI/bge-reranker-base 和 BAAI/bge-reranker-large，比 embedding 模型更强大。我们建议使用或微调它们来对 embedding 模型返回的 top-k 文档进行重新排序。
- 更新 embedding 模型：发布 bge-*-v1.5 embedding 模型，以缓解相似度分布问题，并增强其在无指令情况下的检索能力。

更多

2023年9月7日：更新微调代码：新增挖掘难负样本的脚本，并支持在微调时添加指令。
2023年8月9日：BGE 模型已集成到 Langchain 中，您可以像这样使用；C-MTEB 排行榜已上线。
2023年8月5日：发布 base 和 small 规模模型，在同尺寸模型中性能最佳 🤗
2023年8月2日：发布 bge-large-*（BAAI General Embedding 的缩写）模型，在 MTEB 和 C-MTEB 基准测试中排名第一！ :tada: :tada:
2023年8月1日：我们发布了中文大规模文本嵌入基准（C-MTEB），包含 31 个测试数据集。

模型列表

bge 是 BAAI general embedding 的缩写。

模型	语言		描述	检索用 query 指令 [1]
BAAI/llm-embedder	英文	推理微调	一个统一的 embedding 模型，支持大语言模型多样化的检索增强需求	参见 README
BAAI/bge-reranker-large	中文和英文	推理微调	一个交叉编码器模型，更准确但效率较低 [2]
BAAI/bge-reranker-base	中文和英文	推理微调	一个交叉编码器模型，更准确但效率较低 [2]
BAAI/bge-large-en-v1.5	英文	推理微调	版本 1.5，具有更合理的相似度分布	`Represent this sentence for searching relevant passages:`
BAAI/bge-base-en-v1.5	英文	推理微调	版本 1.5，具有更合理的相似度分布	`Represent this sentence for searching relevant passages:`
BAAI/bge-small-en-v1.5	英文	推理微调	版本 1.5，具有更合理的相似度分布	`Represent this sentence for searching relevant passages:`
BAAI/bge-large-zh-v1.5	中文	[推理](#usage-for-embedding

bge-small-zh-v1.5

简介

模型卡片

模型配置

模型详情

模型列表

标签

操作

详细信息