网站首页 > 精选文章 / 正文
最近一直在研究知识库的产品,包括maxkb、fastgpt、dify等,发现一些共性;这些产品对知识库的索引能力太差; 基本都是 向量检索、全文检索、混合检索这三种;
但是这三种方式往往获取的内容比较割裂,都是片段内容; 真正的知识内容是 相互关联的 是个网状结构;
比如我想检索 中午吃点啥? 单纯的向量或者全文检索,是没有什么内容的;必须通过 知识图谱 来分析:我的位置、我的喜好、周围餐厅等,才能产生有效的信息推荐;
今天来讲一个比较不错的框架:知识增强生成(KAG:Knowledge Augmented Generation)
这个框架充分利用了知识图谱和向量检索的优势,解决了我上面说的场景;它是蚂蚁开源的框架,github地址是:
https://github.com/OpenSPG/KAG
官方对硬件要求如下:
CPU ≥ 8 cores; RAM ≥ 32 GB; Disk ≥ 100 GB;
Linux 用户:CentOS 7 / Ubuntu 20.04 或更新版本 (windows 和mac 也可以,参考官方文档)
要求不是太高,楼主用的 4090 服务器,完全够用
1、安装框架
安装比较简单,用docker安装即可:
curl -sSL https://raw.githubusercontent.com/OpenSPG/openspg/refs/heads/master/dev/release/docker-compose.yml -o docker-compose.yml
docker compose -f docker-compose.yml up -d
可以看到,安装了以下几个产品:
release-openspg-server、release-openspg-mysql、release-openspg-neo4j、release-openspg-minio
安装完成后,通过浏览器输入 http://你的ip:8887, 可访问openspg-kag 产品了。
刚开始是空白的,纯技术思维的产品,配置起来有点复杂;
2、配置一个知识库
点击创建知识库:
出来这个东西,高级配置里面,是要输入json字符,只能看文档,我把官方文档拷贝出来给大家看下:
由于最近deepseek 接口不稳定,在模型配置里面我用的是 千问,参考配置:
{"api_key":"sk-xxxxx","base_url":"https://dashscope.aliyuncs.com/compatible-mode/v1","model":"qwen-plus","client_type":"maas"}
3、上传文档
由于不支持word格式,我把word的转成了pdf上传,文档是 操作教程,大概 2M大小;分成 24个功能介绍;点击下一步后,就看他一步步处理文档了:
提示:过程缓慢、需要耐心
4、验证结果
等了大概 10分钟后,终于处理完了,可以在列表 点击 “抽取结果”,会发现文档被图形化了
离散的功能点被串联成了知识图谱;这样内容和内容之间就产生了关系;
我们去测试回答情况:
当我问 如何增加 知识库 时,对方的回答就非常全面,不仅告诉我了在哪里操作,还有些扩展的内容,比如 如何修改、如何优化; 这个回复内容就非常有价值了;
这个框架什么都好,就是慢; 也许是做了更多分析的缘故,适用于“不着急”回复的场景;后续研读下源码,看如何调优;
Tags:minio安装
猜你喜欢
- 2025-05-22 SpringBoot+LayUI后台管理系统开发脚手架
- 2025-05-22 七爪源码:这是在 Go 中进行实时重新加载的好方法
- 2025-05-22 在Windows环境下,本地部署和启动开源项目Ragflow的源代码
- 2025-05-22 开源&Docker:何必nextcloud,新晋神级私人云盘,在线office编辑
- 2025-05-22 打造企业级自动化漏洞修复系统结( GitOps + Trivy + Argo CD )
- 2025-05-22 基于 Open Policy Agent + SPIRE 的零信任架构实战指南》
- 2025-05-22 告别繁琐代码?Maxun:你的无代码网页数据抓取新选择
- 2025-05-22 科技大事件:黑莓第一季度财报公布 亏损2800万美元
- 2025-05-22 玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
- 2025-05-22 【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库