封面图片

🎾 RAG的28种优化技术

本文深度探讨了28种前沿的检索增强生成(RAG)技术,从基础RAG流程到幻觉检查、文本分块优化、查询增强、上下文管理,再到高级检索范式(如Agentic RAG和Graph RAG)。通过详细阐述每种方法的流程图、关键步骤、示例Prompt,旨在为RAG系统开发者和研究者提供全面的技术选型指南与优化思路,助力构建更智能、更精准、更可靠的AI问答系统。RAG优化、检索增强生成、LLM幻觉、文本分块、向量数据库、Prompt工程、查询重写、上下文管理、语义分块、混合检索、重排名、Agentic RAG、Graph RAG、知识图谱、AI问答系统、自然语言处理、大语言模型、信息检索、深度学习、AI应用开发、人工智能技术、可解释AI、智能系统。

2025-06-19
36 min
封面图片

🧨 使用LLaMA-Factory微调Qwen3

本文从为什么需要微调开始,详细介绍了微调的作用、工具,数据集的构建、工具,数据集增强,实际微调步骤,微调参数配置。并使用gpt4o生成相关讲解图片。

2025-05-20
39 min
封面图片

⚽ 编写支持VLLM部署Qwen3-32B的MCP Cleint/Server

本文详细介绍了MCP Server与MCP Client的开发并给出了示例代码,支持将MCP tool转换为OpenAI tool,使其支持了使用VLLM部署的本地大模型Qwen3-32B。并进行了简单的测试验证,完整的完成了数据库查询,文件写入等MCP tool的调用。

2025-06-30
12 min