AI 模型库
共 个模型
pythia-70m-deduped
text-generation
EleutherAI
·
EleutherAI/pythia-70m-deduped
*Pythia Scaling Suite* 是一组为促进可解释性研究而开发的模型集合(详见论文)。该套件包含两组共八个模型,参数量分别为70M、160M、410M、1B、1.4B、2.8B、6.9B和12B。每个参数量对应两个模型:一个基于Pile数据集训练,另一个基于P
1,963,084
28
transformers
DeepSeek-V4-Pro
text-generation
deepseek-ai
·
deepseek-ai/DeepSeek-V4-Pro
DeepSeek-V4:迈向高效百万级Token上下文智能
1,339,144
3838
transformers