标签: LLM

共找到 19 篇文章

封面图片

🗨️ LLM 应用中的消息管理

在大模型(LLM)应用开发中,对话是最核心的交互方式,而消息管理则是实现高效对话的关键。本文系统梳理了 LLM 中常见的消息类型(System、User、Assistant、Tool)及其作用机制,深入分析了短期记忆与长期记忆的差异,并对比了四种典型的消息管理方案:完整保留、抽象化存储、分层存储、知识库化。通过客服机器人与金融投顾两类实际场景案例,文章探讨了不同方案的优劣与适用场景,帮助开发者在 Token 成本、上下文管理和可追溯性之间做出平衡。

2025-09-28
5 min
封面图片

🎾 RAG的28种优化技术

本文深度探讨了28种前沿的检索增强生成(RAG)技术,从基础RAG流程到幻觉检查、文本分块优化、查询增强、上下文管理,再到高级检索范式(如Agentic RAG和Graph RAG)。通过详细阐述每种方法的流程图、关键步骤、示例Prompt,旨在为RAG系统开发者和研究者提供全面的技术选型指南与优化思路,助力构建更智能、更精准、更可靠的AI问答系统。RAG优化、检索增强生成、LLM幻觉、文本分块、向量数据库、Prompt工程、查询重写、上下文管理、语义分块、混合检索、重排名、Agentic RAG、Graph RAG、知识图谱、AI问答系统、自然语言处理、大语言模型、信息检索、深度学习、AI应用开发、人工智能技术、可解释AI、智能系统。

2025-06-19
36 min