模型库 / BAAI/bge-small-zh-v1.5

bge-small-zh-v1.5

BAAI feature-extraction transformers zh
BAAI/bge-small-zh-v1.5
2,539,200
下载量
113
收藏数
7
浏览量
mit
许可

简介

Model List | FAQ | Usage | Evaluation | Train | Contact | Citation | License

模型卡片

许可协议 mit
语言
zh

模型配置

模型类型 bert
架构 BertModel

模型详情

已翻译

FlagEmbedding

    模型列表 | 
    常见问题 |
    使用方法  |
    评估 |
    训练 |
    联系我们 |
    引用 |
    许可证

更多详情请参阅我们的 Github:FlagEmbedding

英文 | 中文

FlagEmbedding 可以将任意文本映射为低维稠密向量,用于检索、分类、聚类或语义搜索等任务。
它也可用于大语言模型的向量数据库。

*** 🌟更新🌟 **
- 2023年10月12日:发布 LLM-Embedder,一个统一的 embedding 模型,支持大语言模型多样化的检索增强需求。论文 :fire:
- 2023年9月15日:BGE 的技术报告已发布
- 2023年9月15日:BGE 的大规模训练数据已发布
- 2023年9月12日:新模型:
-
*新的 reranker 模型
:发布交叉编码器模型 BAAI/bge-reranker-baseBAAI/bge-reranker-large,比 embedding 模型更强大。我们建议使用或微调它们来对 embedding 模型返回的 top-k 文档进行重新排序。
- 更新 embedding 模型:发布 bge-*-v1.5 embedding 模型,以缓解相似度分布问题,并增强其在无指令情况下的检索能力。

更多

  • 2023年9月7日:更新微调代码:新增挖掘难负样本的脚本,并支持在微调时添加指令。
  • 2023年8月9日:BGE 模型已集成到 Langchain 中,您可以像这样使用;C-MTEB 排行榜上线
  • 2023年8月5日:发布 base 和 small 规模模型,在同尺寸模型中性能最佳 🤗
  • 2023年8月2日:发布 bge-large-*(BAAI General Embedding 的缩写)模型,在 MTEB 和 C-MTEB 基准测试中排名第一! :tada: :tada:
  • 2023年8月1日:我们发布了中文大规模文本嵌入基准C-MTEB),包含 31 个测试数据集。

模型列表

bgeBAAI general embedding 的缩写。

模型 语言 描述 检索用 query 指令 [1]
BAAI/llm-embedder 英文 推理 微调 一个统一的 embedding 模型,支持大语言模型多样化的检索增强需求 参见 README
BAAI/bge-reranker-large 中文和英文 推理 微调 一个交叉编码器模型,更准确但效率较低 [2]
BAAI/bge-reranker-base 中文和英文 推理 微调 一个交叉编码器模型,更准确但效率较低 [2]
BAAI/bge-large-en-v1.5 英文 推理 微调 版本 1.5,具有更合理的相似度分布 Represent this sentence for searching relevant passages:
BAAI/bge-base-en-v1.5 英文 推理 微调 版本 1.5,具有更合理的相似度分布 Represent this sentence for searching relevant passages:
BAAI/bge-small-en-v1.5 英文 推理 微调 版本 1.5,具有更合理的相似度分布 Represent this sentence for searching relevant passages:
BAAI/bge-large-zh-v1.5 中文 [推理](#usage-for-embedding

标签

bert zh arxiv:2310.07554 arxiv:2309.07597 license:mit text-embeddings-inference endpoints_compatible deploy:azure

操作


详细信息

厂商
BAAI
任务
feature-extraction
框架
transformers
模型类型
bert
许可(HF)
mit
语言
zh