专场:知识图谱在 RAG 和私域上下文构建中的实践 
......
专场出品人:
......
......
何汉东
中兴通讯 有线研究院 AI 算法工程师
中兴通讯知识图谱与AI应用技术专家。致力于引领先进数据治理和知识工程理论在企业级复杂私域业务场景的创新实践。主导构建了有线院端到端运维知识体系建设与多源异构数据的智能化知识图谱挖掘,有力推动了上下文工程与生成式AI在故障诊断、装配工艺检索等私域场景的实战部署,为有线数据产品打造了高效可靠的智能化知识服务新范式。
待定
待定
私域破局实战:“图谱+向量”双引擎的上下文构建之道
议题背景:
在企业大模型私域落地场景中,传统RAG模式在应对跨文档推理、深度业务关联的复杂挑战时,常面临逻辑断裂和幻觉频发的工程瓶颈。本次分享将聚焦基于知识图谱的上下文工程演进,剖析如何通过“图谱+向量”双引擎架构实现私域知识从离散存储到逻辑关联的深度重构。将系统性阐述如何利用知识图谱的结构严谨性构建具备因果推理能力的智能上下文,贯通数据与知识的固有壁垒,从而驱动生成式AI从“模糊搜索”向“确定性推理”的战略跃迁。

内容大纲:
1. 破局:私域RAG的上下文瓶颈与逻辑重构
    1.1 痛点剖析:传统向量RAG的“语义匹配”局限性——跨文档关联断裂、幻觉溯源缺失的工程真相。
    1.2 范式演进:架构重塑——从“离散片段检索”转向“拓扑结构导向的确定性推理”范式迁移。
2. 造物:私域知识的结构化生产与敏捷治理
    2.1 知识流水线(Pipeline): 
          基于大模型的信息抽取与实体对齐技术,实现从非结构化文本到结构化知识单元的自动化生产。
    2.2 Schema-Adaptive 策略:
          摒弃重型本体设计,采用“弱 Schema”演进模式,实现知识网络随业务场景的敏捷构建与动态扩展。
3. 协同:双引擎架构下的“上下文重构”方案
    3.1 混合检索与动态路由:
         意图驱动下的双引擎协同机制,如何平衡向量检索的覆盖广度与知识图谱的推理深度。
    3.2 上下文逻辑重构: 
           基于知识子图与语义片段融合算法构建“语义+拓扑”双维度的增强型Prompt,实现推理链条的可解释性。
4. 实战:私域场景智能应用落地与成效
    4.1 知识中台与私域Agent部署:
          ZTE知行系统驱动下的私域场景应用落地与成效。
    4.2 知识驱动的业务正反馈闭环:
          “用户反馈 -> 知识图谱修正 -> AI 能力自进化”的闭环迭代体系,实现私域知识在业务应用中的动态价值沉淀。
5. 总结与展望

听众收益:
业务管理者:了解如何利用知识图谱提升私域AI的实用性,解决幻觉溯源缺失与逻辑断裂难题,提升业务决策确定性。
技术专家/工程师:掌握“图谱+向量”双引擎协同机制与知识自动化加工流程,提升复杂业务场景下的上下文构建质量与推理精度。

王净
百度地图 测试开发工程师
百度地图 测试开发工程师,目前主要负责百度地图服务端自动化测试、持续集成/持续交付(CI/CD)流水线的建设与优化,以及质量度量与效能分析平台的搭建,保障百度地图导航、搜索、定位、路线规划等核心功能的质量和稳定性,支撑百度地图在出行、物流、智能驾驶等场景下的高质量交付。
待定
待定
智能 Code Review 工程实战:
LLM Agent驱动的业务知识飞轮与上下文构建
议题背景:
在业务高速迭代下,代码缺陷拦截面临两大核心技术挑战:一是散落在iCafe卡片、CR评论、线上事故中的业务经验无法被系统性利用;二是传统静态规则无法理解业务语义,导致高误报与漏召并存。我们构建了以LLM Agent为核心的业务知识飞轮体系,通过知识挖掘Agent自动从线上Bug、标注反馈等多源数据中萃取结构化规则,经语义向量+代码向量+BM25稀疏向量三路融合检索实现精准规则召回,并结合跨库静态分析构建代码语义图补全上下文断裂。整套体系形成"发现→结构化→入库→检索→复核→反馈"的自增长闭环,使检测能力随业务迭代持续进化,而非依赖人工维护规则。同时,我们已将完整的扫描SOP封装为Claude Code Skill,开发者在命令行中即可一键调用智能CR全流程能力,真正实现从技术方案到开发者日常工作流的无缝嵌入。

内容大纲:
1. 问题本质:为什么代码缺陷拦截需要"业务知识"
    1.1 基础规则能覆盖的 vs 需要业务上下文才能判断的——两类缺陷的本质区别
    1.2 业务知识散落在哪里:iCafe卡片、CR评论、代码库README、QA知识库、RD口头经验
    1.3 核心矛盾:知识以非结构化形式存在,而LLM检测需要结构化规则输入
2. 线上历史问题的自动挖掘与结构化
    2.1 多源数据采集体系设计
          2.1.1 线上/线下Bug:定期从iCafe空间召回已闭环卡片,提取缺陷模式
          2.1.2 代码库级规则:从模块代码库中提取RD编写的业务约束、CR评论中的隐性知识
          2.1.3 标注系统数据:用户采纳/拒绝行为 + 代码前后diff对比的自动评测标注
    2.2 LLM驱动的数据清洗流水线
          2.2.1 初筛去冗→异值补全→格式统标→完整性验证的四步清洗
          2.2.2  踩坑:如iCafe卡片描述高度口语化,LLM如何从"配置写错了导致崩了"中提取出精确的缺陷模式
          2.2.3 规则预处理:从自然语言到可检索的结构化规则
          2.2.4 LLM拆解非结构化规则为:规则描述、典型代码片段、变量标签、来源权重
          2.2.5 缺陷聚类合并:如何检测矛盾规则并自动合并(如同一函数的不同边界条件规则)
3. 业务知识飞轮:让规则自己"长出来"
    3.1 知识挖掘Agent的核心判定机制
          3.1.1 正负样本分流:新数据按业务逻辑分为正向(有效缺陷)/负向(误报)
          3.1.2 三层分级向量匹配:与现有规则库比对,命中则更新采纳/拒绝计数,未命中则触发新规则挖掘
          3.1.3 临时豁免库设计:负向数据匹配已有规则时的处理策略,防止有效规则被误删
    3.2 规则的向量化入库设计
          3.2.1 三类向量并存:语义向量(规则标题+描述)、代码向量(代码切片+修复建议)、BM25稀疏向量(核心变量名
                   倒排索引)
          3.2.2 踩坑:代码切片向量化时,函数签名 vs 函数体 vs 关键语句的粒度选择对召回效果的影响
    3.3 双Agent检索架构
          3.3.1 召回检索Agent:硬过滤(语言/产品线)→ 语义路(函数体向量+diff向量检索)+ 关键字路(BM25)→ 
                   归一化融合排序(RRF加权 + 采纳率权重 + 来源权重)
          3.3.2 复核检索Agent:在召回基础上增加缺陷标题/描述/类型的语义向量检索维度,top-N规则注入复核prompt
     3.4 闭环反馈机制
          3.4.1 LLM自动评测标注:对比修改前后代码是否按建议修复,自动生成标注
          3.4.2 规则权重的动态衰减与增强:长期未被命中的规则如何处理
4. 跨库代码语义图:补全上下文断裂
    4.1 问题还原:单文件分析+LLM拼接导致跨库调用信息丢失
    4.2 Semgrep选型的关键决策点:免编译 + 混合语言AST + 自定义规则三个硬约束
    4.3 三级流水线:Semgrep符号表生成 → 近似调用图构建 → LLM语义推理补齐隐式调用
    4.4 冗余调用过滤:日志打印、格式化字符串、简单赋值等噪声调用的识别与剔除
    4.5 递归调用的exclude_patterns配置、跨多行函数体的multiline匹配
5. 多场景调度
    5.1 Prompt-Agent分层:按缺陷类型(稳定性/配置/性能)和语言特性拆分专用prompt
    5.2 LLM-Agent解耦:支持外部模型(Claude/Gemini)与内部模型(Ernie/Qwen/SFT)按业务密级切换
    5.3 评测-Agent保障:标准化测试集 + 自动化跑测,每次prompt迭代的回归检测

听众收益:
1. 掌握一套LLM Agent驱动的知识飞轮构建方法论:从多源异构数据中自动萃取结构化规则的完整技术路径,包括数据清洗、规则预处理、三类向量化入库、双Agent检索架构的设计细节与踩坑经验,可迁移至需要"从历史经验中自动学习"的工程场景。
2. 获得LLM与静态分析工具协同的实战经验:跨库语义图构建的工程落地细节,包括选型决策依据、语法兼容性问题的处理、冗余调用过滤策略,以及LLM语义推理补齐隐式调用的具体做法,避免在类似场景中重复踩坑。
3. 理解业务知识工程从冷启动到自增长的完整闭环设计:如何从零构建"采集→清洗→向量化→检索→反馈→规则自进化"的闭环体系,特别是正负样本驱动的规则动态权重机制和用户反馈的结构化回流设计,适用于任何需要持续演进检测能力的质量保障场景
敬请期待
......
.....
待定
待定
敬请期待
....
关注QECon公众号
关注QECon视频号
议题投稿 
lijie@qecon.net  
票务联系 
18649077637  Lily 
 
媒体合作
135-1619-6409  皮皮
商务合作
151-2264-3988  木子
购票咨询
18649077637  Lily
服务总线
400-183-9980  
电话咨询
联系电话:
18649077637  Lily