课题组已经中标中兴公司 2026年产学研揭榜挂帅项目:大模型智能体风险控制和安全技术研究,具体方向如下:
1.环境感知型行为约束与“副作用”评估引擎。对网络运维参数修改(如基站功率、BGP 配置等)等操作,使用数字孪生进行影子演练,来量化操作的影响半径和 SLA 副作用,建立安全熔断机制,防止智能体自主操作引发系统性风险;
2.“意图对齐”监控与长程任务目标漂移检测。 对长周期任务设置语义检查站,通过对比推理链(CoT)和初始意图的语义距离,识别并纠正任务执行中的逻辑偏差与目标漂移,来确保长程任务不偏离合规目标;
3.基于 DID 的身份管理与分布式信任模型。采用 W3C DID 标准与 VC(可验证凭证)构建混合信任模型,实现人类向智能体的全链路授权委派;利用 OIDC4VP等机制实现跨域 Token 安全交换与操作精准溯源;
4.跨智能体协议(MCP/A2A)安全增强与语义审计。在协作层构建语义级DPI 网关,拦截隐藏在协作指令中的语义注入攻击;建立全量意图审计日志,将Agent 间的“黑盒”交互转化为人类可读、可搜索的逻辑链条;
5.“以智制智”,防御性智能体集群与共识校验。构建安全哨兵 Agent,对核心决策引入异构模型共识校验(如 3 选 2 策略),利用红队 Agent 持续进行压力测试,实现防御补丁的自动化生成与系统内生抗性增强。