项目简介 #
智库RAG是一个基于私有知识库的企业级智能对话平台,允许用户上传文档构建专属知识空间,并通过自然语言交互方式查询和获取知识。结合大语言模型和向量检索技术,用户可以通过对话的形式与自己的知识库进行高效交互。
技术栈 #
Spring Boot、MySQL、Redis、Apache Tika、Ollama、Elasticsearch、MinIO、Kafka、Spring Security、WebSocket
核心技术亮点 #
- BitMap分片状态管理 — 使用 Redis BitMap 存储文件分片上传状态,1000个分片仅需125字节
- 双引擎搜索 — Elasticsearch + IK分词器 + 豆包Embedding(2048维)实现「关键词+语义」双引擎搜索,KNN向量召回 + BM25重排序
- 大文件断点续传 — Redis + MinIO 实现,1GB文件上传从15s降至3s
- Kafka异步流水线 — 文档上传、解析、向量化全流程异步解耦,500M文件上传仅需200ms
- 多轮对话管理 — 基于Redis的会话机制,7天过期,保障多轮对话上下文完整性