标签: LLM

共找到 20 篇文章

封面图片

👑 RAG 评估--Dingo框架

RAG(检索增强生成)系统的核心在于“先检索,再生成”,其质量取决于检索的相关性、排序的合理性和生成的可信度。Dingo框架提供三种评估方式:基于规则的校验、基于大模型的语义评估和基于本地模型的推理评估。评估指标包括答案忠实度、答案相关性、上下文相关性、上下文召回和上下文精度。推荐使用真实用户数据生成评估集,以提高评估的可信度和质量。持续评估和优化是RAG系统成功的关键。

2026-04-01
8 min
封面图片

🗨️ LLM 应用中的消息管理

在大模型(LLM)应用开发中,对话是最核心的交互方式,而消息管理则是实现高效对话的关键。本文系统梳理了 LLM 中常见的消息类型(System、User、Assistant、Tool)及其作用机制,深入分析了短期记忆与长期记忆的差异,并对比了四种典型的消息管理方案:完整保留、抽象化存储、分层存储、知识库化。通过客服机器人与金融投顾两类实际场景案例,文章探讨了不同方案的优劣与适用场景,帮助开发者在 Token 成本、上下文管理和可追溯性之间做出平衡。

2025-09-28
5 min