00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

2025-10-22 10:12:01 来源：实况网

小大

上海交通大学计算机学院（网络空间安全学院、密码学院）本科生徐菲悦作为第一作者的论文“A Multidimensional Evaluation Framework for Robustness and Alignment in Large Language Models”被计算机安全顶级学术会议 IEEE Symposium on Security and Privacy 2026（简称 IEEE S&P）录用。论文提出面向大型语言模型（LLM）的“安全魔方（Security Cube）”评估体系，构建覆盖攻击、防御与判定三大维度的多指标框架，为大模型安全评估建立统一多维框架，系统化刻画攻击与防御版图，为大模型安全研究与产业落地提供全方位安全分析底座。该研究由王烁、贺超翔、胡宏盛、孙士锋、谷大武等老师指导，合作者包括交大研究生杭晟、刘修铭、赵宇博，以及微软首席科学家Bin Zhu等。据悉，本次 IEEE S&P全球仅录用118篇论文，本科生作为第一作者在 IEEE S&P2025 发文在大陆地区尚属首次。

IEEE S&P、ACM CCS、Usenix Security、NDSS称为网络与信息安全领域四大国际顶级学术会议，代表着国际网络与信息安全研究的最前沿水平。

从“攻防样例”走向“系统评价”，构建“安全魔方”统一多维评估框架

大型语言模型在通用智能方面取得显著突破，但现实世界的越狱（jailbreak）等攻击会诱导模型输出不当内容，威胁高风险应用中的安全、合规与信任。现有评估多依赖单一的攻击成功率等指标，难以反映攻击可复现性、跨模型与跨防御的普适性，以及对模型内部机制的实质性影响，导致安全治理缺乏统一、可比较的评价基准。

论文对越狱攻击与防御方法进行了结构化分类，进一步提出安全魔方（Security Cube），从攻击者轴、防御轴、评判轴三条主轴系统刻画 LLM 安全性，共引入14项指标，并对13 种攻击、5 种防御与 4 种评判器进行了全面评测。

其中，框架新增并强调了多项关键度量，用以弥补传统单指标评价的不足，包括：

攻击稳定性与可重复性：衡量攻击在不同设置下是否稳定复现；

跨防御、跨模型的可迁移性：评估攻击是否能跨越不同防护策略与模型架构；

内部破坏程度：判断攻击是否仅绕过表层过滤，还是对模型内部激活与安全检查造成了本质影响；

对抗效率：刻画实现成功攻击所需的计算/查询成本，支持在安全与效率之间进行工程权衡。

该魔方框架从指标维度与实验设计两方面统一了攻击、加固与裁决的评价语言，为研究者横向比较不同方法、为工程团队制定安全基线与合规标准、为监管机构形成可量化的审查视角提供了可操作的“通用量表”。

学生风采

第一作者徐菲悦为上海交通大学计算机学院2022级本科生，已获直博资格。在校期间曾获国家奖学金、本科生 A 等奖学金、优秀学生干部等多项荣誉；作为核心成员获得2024 全球 AI 攻防挑战赛季军与杰出方案奖等成绩，展现了面向真实场景问题的攻防能力与工程落地潜力。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

责任编辑：kj015

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

华硕上架破晓 Pro14 2024 款笔记本：Ultra 5-125H + 32GB + 1TB，5599 元

华为公布鸿蒙 HarmonyOS 4.2 主要亮点，全新小艺支持 AI 消除

雷柏（Rapoo）V500PRO-87 键盘升级款上架预约，首发价 89 元

知名电脑外设品牌冰豹将退出历史舞台，所有产品线并入乌龟海岸

中华网家电

00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

2025年口碑好的民宿太空舱,户外太空舱厂家推荐及选择指南

【医生科普】斑秃的症状表现

2025年评价高的斜纹纸布,纸绳纸布,花边纸布,钩针纸布厂家最新推荐

2025年市场多功能警用装备柜,智能警用装备柜,定制装备柜推荐生产厂家

2025年热门的自动净化门,净化门,手术室净化门,净化门窗厂家推荐及采购指南

1011加密货币市场闪崩事件调查报道

相关新闻

澳洲品质铸就千万敏宝家庭信赖！Witsbb健敏思以无敏100+引领健康新趋势

顺德95岁老人顺利完成为白内障手术，重获清晰视界

湖北荆州联通反诈科普+红色观影，把服务送到村民心坎上

国货之光闪耀世界航海装备大会，海洋至尊三度参展成男士护肤代表

昌平篮·耀未来-2025昌平“未来杯”篮球超级联赛开幕式荣耀启幕

湖北荆州联通青年路营业厅：暖心服务解民忧点滴细节见真情

文化赋能，价值破局：宜尚西安以差异化体验重塑旅宿竞争优势

湖北荆州联通深耕社区服务：光纤升级进小区，贴心服务暖民心

将服务延伸到会场：柏曼酒店闪销分队派礼，贴心举动引客商点赞

湖北荆州联通数字乡村建设显成效通信服务保障暖人心

家电推荐

家电图片

圣境寻源·本草甘南——永春健道地中药文化与生态溯源之旅完美收官

TeamViewer ，让远程医疗从想象走进现实

A.O.史密斯（中国）首次当选 2025典范雇主——企业ESG影响力典范企业

八子补肾闪耀2025国际抗衰老与稳态医学大会用东方智慧照亮抗衰新路径

热烈庆祝南昌普瑞眼科医院SMILEpro手术量突破500例

江西首家龙晶PR全国培训中心落户南昌普瑞眼科医院

新闻排行

澳洲品质铸就千万敏宝家庭信赖！Witsbb健敏思以无敏100+引领健康新趋势

顺德95岁老人顺利完成为白内障手术，重获清晰视界

湖北荆州联通反诈科普+红色观影，把服务送到村民心坎上

国货之光闪耀世界航海装备大会，海洋至尊三度参展成男士护肤代表

昌平篮·耀未来-2025昌平“未来杯”篮球超级联赛开幕式荣耀启幕

湖北荆州联通青年路营业厅：暖心服务解民忧点滴细节见真情

文化赋能，价值破局：宜尚西安以差异化体验重塑旅宿竞争优势

湖北荆州联通深耕社区服务：光纤升级进小区，贴心服务暖民心

将服务延伸到会场：柏曼酒店闪销分队派礼，贴心举动引客商点赞

湖北荆州联通数字乡村建设显成效通信服务保障暖人心

00后担大梁交大本科生在计算机安全顶级会议上实现突破，打造大模型全方位安全分析底座

相关新闻

家电推荐

家电图片

圣境寻源·本草甘南——永春健道地中药文化与生态溯源之旅完美收官

TeamViewer ，让远程医疗从想象走进现实

A.O.史密斯（中国）首次当选 2025典范雇主——企业ESG影响力典范企业

八子补肾闪耀2025国际抗衰老与稳态医学大会 用东方智慧照亮抗衰新路径

热烈庆祝南昌普瑞眼科医院SMILEpro手术量突破500例

江西首家龙晶PR全国培训中心落户南昌普瑞眼科医院

新闻排行

八子补肾闪耀2025国际抗衰老与稳态医学大会用东方智慧照亮抗衰新路径