原创内容
AI 系列教程 · 热点深度解读
阿里成立 Token Foundry 事业部,CEO 亲自挂帅:大模型进入商业化冲刺阶段
阿里巴巴合并通义大模型事业部和未来生活实验室,成立 Token Foundry 事业部由 CEO 吴泳铭直接负责,五年目标 AI 年收入突破 1000 亿美元。深度解析组织变革背后的行业信号。
AI 全栈开发实战(6):向量检索与 RAG 问答 —— Qdrant 检索、Re-rank、流式输出
实现基于知识库的智能问答:Qdrant 向量检索与 Cross-Encoder 重排序、流式 SSE 问答 API、对话管理、前端流式渲染 Hook 与对话界面,让上传的文档真正可问答。
AI 模型的 Prompt 注入攻击与防护
Prompt 注入攻击原理和 AI 应用的安全防护方案
MiniMax M3 发布实测:国产模型编程能力首次超越 GPT-5.5,100 万上下文 + 多模态
MiniMax M3 正式发布,采用全新稀疏注意力架构 MSA,编程能力在 LiveCodeBench/SWE-bench 上超越 GPT-5.5 和 Gemini 3.1 Pro,支持 100 万 token 上下文和原生多模态。本文包含 benchmark 数据、实际体验和价格对比。
AI 全栈开发实战(5):文档处理 Pipeline —— 解析、切分、Embedding、存入 Qdrant
实现文档处理完整 Pipeline:PDF/文本解析、递归字符切分、BGE Embedding 向量化、Qdrant 向量存储、Celery 异步任务、前端状态轮询,上传即自动处理。
AI 开发的本地开发环境配置指南
GPU 开发环境、容器化开发、远程开发的全套方案
AI 全栈开发实战(4):知识库与文档管理 —— CRUD API、文件上传、MinIO 集成
实现知识库和文档管理模块:知识库 CRUD 与权限隔离、文档上传与类型验证、MinIO 文件存储、文档列表与删除、前端知识库仪表盘和文件管理页面。
AI 项目的 Git 工作流与协作规范
AI 项目的分支策略、Code Review 流程和协作规范
AI 全栈开发实战(3):用户系统 —— 注册、登录、JWT 认证与前端集成
实现完整的用户系统:bcrypt 密码加密与验证、JWT Token 签发与验证、注册/登录 API、认证中间件、前端登录/注册页面、Auth Context 全局状态管理。
AI 应用的数据流动与安全架构
AI 应用中数据的采集、传输、存储全链路安全设计
AI 全栈开发实战(2):技术选型与项目初始化 —— 搭建 KNow 项目骨架与 Docker 环境
从零初始化 KNow 知识库助手项目:Docker Compose 编排 6 个服务(PostgreSQL/Redis/Qdrant/MinIO/后端/前端)、FastAPI 后端骨架搭建、React 前端项目初始化、开发工作流配置。
AI 项目的需求文档与技术方案编写
AI 项目的需求文档规范和技术方案设计模板
AI 全栈开发实战(1):产品定义与架构设计 —— 做一个真正的 AI 知识库产品
开启 AI 全栈开发实战系列,从产品定义开始到部署上线。本文完成 KNow 知识库助手的定位、功能规划、技术选型、数据库设计、API 设计和架构决策。
AI 模型的成本建模与预算规划
AI 项目的模型调用成本估算方法和大规模预算规划
AI 应用开发实战(5):AI Agent —— 工具调用、自主决策、多步循环完整实现
从零构建一个完整的 AI Agent 系统:工具定义与注册机制、Function Calling 实现、Think-Act-Observe 多步循环、错误处理与容错,以及 Agent 与 Chat/RAG 模式的融合。
用 AI 自动化文档生成的完整方案
利用 LLM 自动生成和维护项目文档的工具链和流程
AI 应用开发实战(4):从零实现 RAG 系统 —— 文档解析、向量检索、知识库问答
从零构建一个完整的 RAG 系统:文档解析与 Chunk 切分策略、Embedding 与向量存储、Query 改写与混合检索、Re-rank 重排序、完整 Pipeline 集成,附可运行的全套代码。
AI 创业公司的技术栈选择策略
AI 创业公司在不同阶段的技术栈选择原则和案例
AI 应用开发实战(3):多轮对话进阶 —— 清除历史、注入 System Prompt、上下文截断策略
深入讲解 AI 应用多轮对话的核心技术:对话上下文管理与记忆机制、System Prompt 动态注入策略、Token 窗口截断算法、多轮对话状态保持,以及生产环境中的长对话优化方案。
AI 知识库产品的技术选型指南
从零搭建 AI 知识库的完整技术选型方案和架构决策