全部 #LLM #AI #LangGraph #RAG #Prompt #LangChain #VectorStore #Knowledge

🎚️ LangGraph实战子图、流响应

记录Langgraph使用过程中遇到的问题以及解决方法

2024-09-12

2 min

#RAG #VectorStore

🍚 向量检索Chroma使用和服务端docker部署

介绍向量检索数据库Chroma的服务端Docker部署，以及客户端基本的使用

2024-10-24

1 min

#LLM

🚢 LLM部署(docker+vllm+embedding+rerank) 支持工具调用

该文档介绍了关于LLM模型部署的内容，包括模型选择、模型下载、模型部署方案以及模型使用和加速方法。推荐的部署方案是使用docker部署，同时提供了本地环境部署的方法。模型加速方面介绍了vllm和flash-attention两种方法。embdding模型，rerank模型

2025-03-27

8 min

#LLM

🚥 如何选择大模型(榜单+指标)

在选择大模型之前，需要明确自己对语言、通识、推理、数学、代码、长文本和工具等七大能力的偏好。评测指标包括MMLU、C Eval、ARC-C、BBH、GSM8K、MBPP、Human Eval、L-Eval和T-Eval。常用榜单包括OpenCompass司南榜单、Huggingface榜单和MTEB榜单。

2025-10-21

4 min