MySQL, Oracle, Linux, 软件架构及大数据技术知识分享平台

网站首页 > 精选文章 / 正文

使用蚂蚁的KAG框架打造更加智能的知识库系统

2025-05-22 10:45 huorong 精选文章 1 ℃ 0 评论

最近一直在研究知识库的产品,包括maxkb、fastgpt、dify等,发现一些共性;这些产品对知识库的索引能力太差; 基本都是 向量检索、全文检索、混合检索这三种;

但是这三种方式往往获取的内容比较割裂,都是片段内容; 真正的知识内容是 相互关联的 是个网状结构;

比如我想检索 中午吃点啥? 单纯的向量或者全文检索,是没有什么内容的;必须通过 知识图谱 来分析:我的位置、我的喜好、周围餐厅等,才能产生有效的信息推荐;

今天来讲一个比较不错的框架:知识增强生成(KAG:Knowledge Augmented Generation)

这个框架充分利用了知识图谱和向量检索的优势,解决了我上面说的场景;它是蚂蚁开源的框架,github地址是:
https://github.com/OpenSPG/KAG

官方对硬件要求如下:

CPU ≥ 8 cores; RAM ≥ 32 GB; Disk ≥ 100 GB; 
Linux 用户:CentOS 7 / Ubuntu 20.04 或更新版本 (windows 和mac 也可以,参考官方文档)

要求不是太高,楼主用的 4090 服务器,完全够用

1、安装框架

安装比较简单,用docker安装即可:

curl -sSL https://raw.githubusercontent.com/OpenSPG/openspg/refs/heads/master/dev/release/docker-compose.yml -o docker-compose.yml
docker compose -f docker-compose.yml up -d

可以看到,安装了以下几个产品:

release-openspg-server、release-openspg-mysql、release-openspg-neo4j、release-openspg-minio

安装完成后,通过浏览器输入 http://你的ip:8887, 可访问openspg-kag 产品了。

刚开始是空白的,纯技术思维的产品,配置起来有点复杂;

2、配置一个知识库

点击创建知识库:

出来这个东西,高级配置里面,是要输入json字符,只能看文档,我把官方文档拷贝出来给大家看下:

由于最近deepseek 接口不稳定,在模型配置里面我用的是 千问,参考配置:

{"api_key":"sk-xxxxx","base_url":"https://dashscope.aliyuncs.com/compatible-mode/v1","model":"qwen-plus","client_type":"maas"}

3、上传文档

由于不支持word格式,我把word的转成了pdf上传,文档是 操作教程,大概 2M大小;分成 24个功能介绍;点击下一步后,就看他一步步处理文档了:

提示:过程缓慢、需要耐心

4、验证结果

等了大概 10分钟后,终于处理完了,可以在列表 点击 “抽取结果”,会发现文档被图形化了

离散的功能点被串联成了知识图谱;这样内容和内容之间就产生了关系;

我们去测试回答情况:

当我问 如何增加 知识库 时,对方的回答就非常全面,不仅告诉我了在哪里操作,还有些扩展的内容,比如 如何修改、如何优化; 这个回复内容就非常有价值了;

这个框架什么都好,就是慢; 也许是做了更多分析的缘故,适用于“不着急”回复的场景;后续研读下源码,看如何调优;

Tags:minio安装

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言