Gemma-3-1B-it-GLM-4.7-Flash-Heretic-Uncensored-Thinking_GGUF
简介
--- license: gemma language: - en base_model: - google/gemma-3-1b-it tags: - uncensored - text-generation - reasoning - instruction-tuned - lightweight --- Gemma 3 – 1B IT GLM-4.7 Flash Heretic 无审查思考模型 本仓库托管 Gemma 3 – 1B IT GLM-4.7 Flash Heretic 无审查模型
模型卡片
模型详情
已翻译license: gemma
language:
- en
base_model:
- google/gemma-3-1b-it
tags:
- uncensored
- text-generation
- reasoning
- instruction-tuned
- lightweight
Gemma 3 – 1B IT GLM-4.7 Flash Heretic Uncensored Thinking
本仓库托管 Gemma 3 – 1B IT GLM-4.7 Flash Heretic Uncensored Thinking,这是一个轻量级的 10 亿参数指令微调模型,源自 Google 的 Gemma 3 1B IT 基础模型。
该变体针对快速推理、结构化推理行为和最小化拒绝模式进行了优化,同时保持与 Gemma 原生指令格式的兼容性。
模型概述
- 模型名称:Gemma 3 – 1B IT GLM-4.7 Flash Heretic Uncensored Thinking
- 参数量:10 亿 (1B)
- 基础架构:Gemma 3
- 基础模型:google/gemma-3-1b-it
- 模型类型:指令微调因果语言模型
- 上下文长度:继承基础模型的上下文窗口
- 主要语言:英语
- 许可证:Gemma License(继承自基础模型)
- 维护者/发布者:DavidAU
这是什么模型?
该模型是 Gemma 3 – 1B IT 的修改衍生版本,配置用于:
- 相比默认 IT 对齐,减少拒绝偏差
- 增强直接回答行为
- 更强的短格式推理输出
- 由于紧凑的参数量,响应延迟更低
- “Flash”风格的简洁快速生成
“Heretic Uncensored Thinking”配置强调:
- 最小化对话过滤
- 直接补全行为
- 在提示时进行结构化推理模式
除基础架构中已有的安全层外,未有意引入任何额外的安全层。
主要特性与能力
核心优势
- 在消费级 GPU 和 CPU 上实现快速推理
- 低 VRAM 需求
- 指令遵循兼容性
- 简洁的推理输出
- 适用于轻量级 agent 流水线
性能特征
- 针对短到中等长度的生成任务进行优化
- 在实时助手应用中响应迅速
- 在工具驱动或思维链风格的提示中表现良好
- 适用于边缘部署和实验场景
预期用例
- 轻量级 AI 助手
- 提示工程实验
- 工具增强型 agent
- 快速响应聊天系统
- 本地推理环境
- 教育或研究工作流
- 受控的“无审查”部署环境
聊天模板与提示格式
该模型遵循 Gemma 指令格式。
为获得最佳效果:
- 提供明确的系统指令
- 在需要时使用结构化推理提示
- 避免混合非 Gemma 聊天格式
硬件与部署说明
由于其 10 亿参数规模:
- 在 8GB GPU 上高效运行
- 适合通过量化进行 CPU 推理
- 适用于边缘设备和低资源环境
- 兼容支持 Gemma 架构的常见推理引擎
可根据部署栈使用量化版本(GGUF、GPTQ、AWQ 等)。
对齐与安全声明
这是一个“无审查”的衍生配置。
- 相比标准 IT,拒绝行为减少
- 用户负责系统提示控制
- 部署应遵循当地法律和道德准则
- 本仓库未添加额外的对齐层
请负责任地使用。
许可证与使用说明
该模型继承其基础模型(google/gemma-3-1b-it)的 Gemma License。
- Gemma License 是 Google 提供的自定义许可证
- 您必须审阅并遵守 Gemma License 条款
- 本仓库不会更改或替换原始许可条款
用户有责任确保遵守所有适用法规。
致谢
- Google 提供 Gemma 3 架构和基础模型
- Hugging Face 生态系统
- 支持轻量级部署的开源工具社区
社区与支持
- 如有问题或疑问,请使用 Hugging Face Discussions 标签
- 欢迎社区实验和基准测试反馈
正在翻译中,请稍候...