ES本地部署

https://www.elastic.co/guide/en/elasticsearch/reference/8.15/docker.html

这里我们直接使用官方的docker-compose文件部署

https://github.com/elastic/elasticsearch/tree/8.15/docs/reference/setup/install/docker

💡 注意修改.env文件中的密码信息

使用

使用es客户端进行连接

es_connection = Elasticsearch("http://127.0.0.1:9200", basic_auth=("elastic", "xxxxxx"))

💡 ES python客户端更多连接方式，见下面的官方文档
https://www.elastic.co/guide/en/elasticsearch/client/python-api/current/connecting.html#connect-self-managed-new

向量检索

vector = [0.1,0.1,0.1]
query_body = {
        "query": {"knn": {"field": "vector", "query_vector": vector, "k": 3}},
        "_source": ["text", "metadata"],
        "size": 3,
  }
es_response = es_connection .search(
    index=index_name, body=query_body
)

混合检索

混合检索指 稠密向量+稀疏向量，因此，混合检索后要使用Rerank进行重排。

Rerank策略有三种：

加权评分
RRF（互惠排序融合）
使用Rerank模型

EShttps://www.elastic.co/guide/en/elasticsearch/reference/current/retriever.html#rrf-retriever提供了RRF重新计算评分，不过该功能并不在自管型ES中提供，使用会提示license不支持。未经尝试。

这里我们使用构建向量检索（稠密向量）+全文检索（ES的全文检索自5.0后模型采用BM25计算相似性）的ES查询体，然后再使用Rerank模型进行重排

# ES 查询体
queries = ["CAD方法", "CAD是什么","CAD有哪些方法"]
vectors = await embeddings.aembed_documents(texts=queries)
bm = [{"match": {"text": {"query": text, "boost": 1}}} for text in queries]

knn = [
    {"knn": {"field": "vector", "query_vector": vector, "k": 3, "boost": 1000}}
    for vector in vectors
]
body =  {
    "query": {"bool": {"should": bm + knn}},
    "_source": ["text", "metadata"],
    "size": 6 * len(queries),
}
es_response = es_connection .search(
    index=index_name, body=body
)

向量检索(KNN) 的得分范围为0-1，全文检索得分范围根据命中的关键词可能无限大。为了使knn检索的结果尽可能的包括在返回结果中，调整KNN查询的的boost为1000，原始得分*1000。(该方法存在问题，待研究)

💡 关于Rerank模型部署参考https://www.wileyzhang.com/llm%E9%83%A8%E7%BD%B2dockervllmembeddingrerank-%E6%94%AF%E6%8C%81%E5%B7%A5%E5%85%B7%E8%B0%83%E7%94%A8