• 新闻中心

      新闻中心  >  2026·WIC博耀受邀分享AI智能体安全治理“新解法”
      2026·WIC博耀受邀分享AI智能体安全治理“新解法”
      背景图 2026-04-17 17:45:47

      领跑AI品牌banner

      4月13日-14日,,2026年世界互联网大会亚太峰会在香港隆重举行。。。本次峰会以“数智赋能 创新发展——携手构建网络空间命运共同体”为主题,,聚焦人工智能安全治理、、智能体创新等核心议题,,,汇聚亚太地区政企学研各界力量,,,,共探数字未来发展新路径。。。

      博耀深度参与本次峰会,,协办“人工智能安全治理论坛”并受邀分享。。该论坛由国家计算机网络应急技术处理协调中心、、、中关村实验室、、、、中国网络空间研究院主办,,以“AI安全治理,,护航人类发展新领域”为主题,,,,围绕人工智能治理思路、、技术风险防范等议题展开深度交流。。。

      从 “内容合规” 到 “行为可控”重构AI智能体安全治理

      博耀副总裁杜智伟受邀出席论坛,,并发表了题为《从“内容合规”到“行为可控”,,智能体失控风险下的AI治理范式重构》的主题演讲。。。杜智伟指出,,AI大模型正在完成一次深刻的角色蜕变——从过去“能说会道”的信息处理器,,进化为“能自主完成任务”的自治Agent。。。。以OpenClaw、、Manus为代表的第三代数字员工类智能体,,,,已具备长程自主规划、、环境感知与跨系统操作能力。。。。这一跃升,,标志着我们正式迈入“智能体元年”。。。

      然而,,AI越智能、、、、价值越突出,,,在深度融入企业级生产场景后,,风险也随之放大,,,安全治理重心亦发生转变。。。博耀安全研究团队将当前AI智能体的核心风险归纳为三类:权限滥用、、、高级提示注入攻击以及“涌现行为”引发的逻辑黑盒。。。。

      面对这些挑战,,博耀提出了从“内容合规”向“行为可控”的治理范式转型,,,,并给出三大防御思路:

      基于零信任的访问控制

      对智能体实施“永不信任,,,,始终校验”策略,,,每次操作均需动态验证身份与权限,,,从源头收窄攻击面;

      动态最小权限原则(PoLP)

      根据智能体的实时任务需求,,,,动态分配最小必要权限,,,杜绝“权限冗余”,,,防止权限被滥用或横向扩散;同时,,,拒绝“长效权限”。。。。例如,,仅授予财务审计Agent访问发票数据库中特定字段(如金额、、、日期)的权限,,,,而非整个财务系统的管理员账号。。。。

      除此之外,,,系统应自动清理“僵尸授权”,,,,一旦检测到智能体长期未活跃,,,立即吊销其API Key,,,,让黑客即便潜入也只是一具“空壳”;

      全链路AI安全护栏

      输入端拦截恶意提示注入,,,,在推理过程中实施行为监控与形式化验证;在输出端进行各类攻击的检测以及恶意信息的拦截,,,,形成端到端的防护闭环。。。。

      博耀副总裁 杜智伟

      博耀副总裁 杜智伟

      博耀倡导“安全原生”理念:以“数字员工”视角管理智能体

      在谈及AI保护落地实践时,,,,杜智伟重点阐述了博耀“构建安全原生智能体应用”的核心理念。。。目前,,,,博耀已建成一套双轨协同治理体系,,,,以语义合规轨与逻辑受控轨并行管控,,,,并针对智能体涌现行为、、权限滥用及执行死循环等风险,,实现自动权限强制剥夺与状态冻结,,,为智能体失控装上了“紧急制动”。。。。

      除此之外,,博耀建议以管理“数字员工”的视角,,,,来管理AI智能体——通过“背调上岗”开展全方位的AI智能体的安全评估与权限匹配,,,通过“划定数字工位”实现智能体最小权限与隔离运行空间,,并依托“动态监督与持续响应”构建起全链路的行为监测体系,,,实时阻断异常操作,,,,确保智能体在安全边界内释放生产力。。。。

      分割线

      智能体是生产力的下一次真正飞跃。。博耀不主张限制AI的进化,,,但坚信:“可控”是“可用”不可逾越的前提。。。我们愿与产业界、、、、学术界及监管机构携手,,,,在效率与安全之间,,找到可执行、、、、可扩展、、、可信任的平衡点,,,,共同向着更有序、、、、更安全的通用人工智能时代稳步迈进。。

      站点地图