第一个站内站

第一个站内站

AI STR新标准发布:智能体运行安全迎来全球首规


在联合国日内瓦总部,世界数字科学院(WDTA)隆重发布了AI STR系列新标准中的《AI智能体运行安全测试标准》。这一标准由蚂蚁集团、清华大学、中国电信领衔,携手普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外知名机构、企业及高校共同编制,标志着全球首个针对单智能体运行安全的测试标准正式诞生。

随着AI技术的飞速发展,智能体已逐渐展现出其强大的能力,从简单的问答交互到复杂的自主决策与执行,AI正以前所未有的速度渗透到各个商业领域。然而,技术进步的背后,安全隐忧也日益凸显。最新调研数据显示,超过70%的智能体从业者对AI幻觉、错误决策以及数据泄露等问题表示担忧。这些问题不仅影响AI技术的可靠性,更可能对用户乃至整个社会造成不可估量的损失。

面对这一挑战,WDTA发布的AI STR新标准无疑为智能体运行安全提供了一道坚实的防线。该标准首次将智能体的输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境相对应,构建了一个全链路的风险分析框架。这一框架不仅有助于全面识别智能体运行过程中的潜在风险,还为风险防控提供了有力的支持。

同时,新标准还细分了智能体的风险类型,并创新性地提出了模型检测、网络通信分析和工具模糊测试等测试方法。这些方法的引入,不仅弥补了智能体安全测试技术标准的空白,更为企业提升AI应用的安全性与可信度提供了切实可行的路径。

值得一提的是,AI STR新标准的发布正值“智能体元年”,这一称谓预示着AI技术将迎来更加广阔的发展空间。然而,正如WDTA执行理事长李雨航所言:“面对AI相关技术的快速演进,我们必须正视‘科林格里奇困境’。”一旦新技术深植社会,其风险治理的代价将成倍上升。因此,AI STR系列标准的出台,正是在这一临界点前建立清晰、可执行的安全标准和测评、认证体系,将伦理与责任嵌入AI的全生命周期之中,确保技术发展真正服务于人类的长期利益。

在峰会上,蚂蚁集团大模型数据安全总监杨小芳也表示,当前AI技术应用加速落地,但单智能体的安全风险缺乏统一的全链路安全测试标准。因此,单智能体标准的制定被视为AI治理的“最小可行单元”,而多智能体治理则是未来“摩天大楼”的核心结构。下一步,行业应从单点逐步向多智能体治理生态共建突破,以形成更加完善、更加安全的AI治理体系。

与其他国际标准相比,AI STR不仅关注风险识别和风险分级,更提供了一整套全流程管理方案。从数据治理到模型落地,配套具体测试工具和认证流程,助力企业全方位提升AI应用的安全性与可信度。这一标准的出台,不仅为全球AI智能体生态的安全、可信和可持续发展提供了有益的探索,更为AI技术的健康发展奠定了坚实的基础。

目前,部分标准的测评与认证已在金融、医疗等领域落地应用,取得了显著的成效。此前,WDTA已发布了3项AI STR标准,包括“生成式人工智能应用安全测试标准”、“大语言模型安全测试方法”和“大模型供应链安全要求”。这些标准的出台,不仅体现了WDTA在AI安全领域的领先地位,更为全球AI技术的健康发展提供了有力的保障。
cache
Processed in 0.013555 Second.