bge-small-zh-v1.5
BAAI
feature-extraction
transformers
zh
BAAI/bge-small-zh-v1.5
2,539,200
下载量
113
收藏数
7
浏览量
mit
许可
简介
Model List | FAQ | Usage | Evaluation | Train | Contact | Citation | License
模型卡片
许可协议
mit
语言
zh
模型配置
模型类型
bert
架构
BertModel
模型详情
已翻译FlagEmbedding
模型列表 |
常见问题 |
使用方法 |
评估 |
训练 |
联系我们 |
引用 |
许可证
更多详情请参阅我们的 Github:FlagEmbedding。
FlagEmbedding 可以将任意文本映射为低维稠密向量,用于检索、分类、聚类或语义搜索等任务。
它也可用于大语言模型的向量数据库。
*** 🌟更新🌟 **
- 2023年10月12日:发布 LLM-Embedder,一个统一的 embedding 模型,支持大语言模型多样化的检索增强需求。论文 :fire:
- 2023年9月15日:BGE 的技术报告已发布
- 2023年9月15日:BGE 的大规模训练数据已发布
- 2023年9月12日:新模型:
- *新的 reranker 模型:发布交叉编码器模型 BAAI/bge-reranker-base 和 BAAI/bge-reranker-large,比 embedding 模型更强大。我们建议使用或微调它们来对 embedding 模型返回的 top-k 文档进行重新排序。
- 更新 embedding 模型:发布 bge-*-v1.5 embedding 模型,以缓解相似度分布问题,并增强其在无指令情况下的检索能力。
更多
- 2023年9月7日:更新微调代码:新增挖掘难负样本的脚本,并支持在微调时添加指令。
- 2023年8月9日:BGE 模型已集成到 Langchain 中,您可以像这样使用;C-MTEB 排行榜已上线。
- 2023年8月5日:发布 base 和 small 规模模型,在同尺寸模型中性能最佳 🤗
- 2023年8月2日:发布
bge-large-*(BAAI General Embedding 的缩写)模型,在 MTEB 和 C-MTEB 基准测试中排名第一! :tada: :tada: - 2023年8月1日:我们发布了中文大规模文本嵌入基准(C-MTEB),包含 31 个测试数据集。
模型列表
bge 是 BAAI general embedding 的缩写。
| 模型 | 语言 | 描述 | 检索用 query 指令 [1] | |
|---|---|---|---|---|
| BAAI/llm-embedder | 英文 | 推理 微调 | 一个统一的 embedding 模型,支持大语言模型多样化的检索增强需求 | 参见 README |
| BAAI/bge-reranker-large | 中文和英文 | 推理 微调 | 一个交叉编码器模型,更准确但效率较低 [2] | |
| BAAI/bge-reranker-base | 中文和英文 | 推理 微调 | 一个交叉编码器模型,更准确但效率较低 [2] | |
| BAAI/bge-large-en-v1.5 | 英文 | 推理 微调 | 版本 1.5,具有更合理的相似度分布 | Represent this sentence for searching relevant passages: |
| BAAI/bge-base-en-v1.5 | 英文 | 推理 微调 | 版本 1.5,具有更合理的相似度分布 | Represent this sentence for searching relevant passages: |
| BAAI/bge-small-en-v1.5 | 英文 | 推理 微调 | 版本 1.5,具有更合理的相似度分布 | Represent this sentence for searching relevant passages: |
| BAAI/bge-large-zh-v1.5 | 中文 | [推理](#usage-for-embedding |
正在翻译中,请稍候...
标签
bert
zh
arxiv:2310.07554
arxiv:2309.07597
license:mit
text-embeddings-inference
endpoints_compatible
deploy:azure