成果速递丨ACM MM 2024：中科视语提出FiLo，实现工业场景零样本异常检测新突破

2024-07-30 16:19:38 来源：实况网

小大

在工业生产和质量控制领域，异常检测始终是一个关键问题。传统的异常检测方法通常依赖大量的正常样本进行训练，但在保护用户数据隐私或应用于新生产线时，这些方法往往不适用。零样本异常检测在这种情况下应运而生，其目的是在没有目标类别物体训练数据的情况下，直接进行异常检测。

近日，中科视语和中国科学院自动化研究所的研究团队提出了一种新的零样本异常检测方法——FiLo。 FiLo方法通过细粒度描述和高质量定位模块，在异常检测和异常定位两个方面取得了显著的性能提升，在零样本异常检测工业场景中取得了业内最好性能。

现有的零样本异常检测方法通常依赖于多模态预训练模型的强大泛化能力，通过计算图像特征与手工编写的表示“正常”或“异常”语义的文本特征之间的相似度来检测异常，并根据文本特征和每个图像块特征的相似度来定位异常区域。然而，通用的“异常”描述往往无法精确匹配不同对象类别中的各种异常类型。此外，文本特征与单个图像块的特征的相似性计算难以准确定位具有不同大小和尺度的异常。

中科视语研究团队提出的FiLo方法为了解决现有零样本异常检测方法在异常检测和异常定位两个方面存在的问题，提出了两个有机结合的模块：自适应学习的细粒度描述模块（FG-Des）和位置增强的高质量定位模块（HQ-Loc）：

自适应学习的细粒度描述模块（FG-Des）主要利用大语言模型（LLMs）的强大知识来生成每个物体类别可能出现的细粒度异常类型，并采用自适应学习的文本模板替代手工编写的文本内容，提高了异常检测的准确性和可解释性。

位置增强的高质量定位模块（HQ-Loc）利用Grounding DINO进行初步定位，并通过位置增强的文本提示和多尺度、多形状的跨模态交互模块（MMCI）来准确定位不同大小和形状的异常。

结合了 FG-Des 和 HQ-Loc 两个模块的 FiLo 方法的整体结构如下图所示：

FiLo首先通过大语言模型（LLMs）生成每个类别可能存在的细粒度异常类型列表，然后将细粒度异常描述填入可学习的文本模板中，通过 CLIP 文本编码器后得到表示“正常”和“异常”语义的文本特征。与此同时，FiLo还将待检测图像和大语言模型生成的细粒度异常描述内容输入到Grounding DINO中，以获得初步的异常定位框，并将初步定位框的位置信息也添加到文本特征中。

接下来，FiLo将待检测图像输入到CLIP图像编码器以提取中间层特征，这些特征通过多尺度、多形状的跨模态交互模块（MMCI）与含有位置信息的文本特征交互，生成异常分数图。最后综合各中间层的异常分数图，即可得到最终的异常图和全局异常得分。

通过这种方法，FiLo能够充分利用LLMs的强大先验知识和Grounding DINO的初步定位能力，再结合MMCI模块的多尺度、多形状特征交互，有效提升了异常检测的准确性和精确定位的能力。

基于上述方法结构，FiLo研究团队在目前流行的 MVTec-AD和VisA两个工业异常检测数据集上进行了实验，与现有零样本异常检测方法相比，FiLo取得了最先进的性能，实验结果如下表所示：

下图还展示了FiLo在一些实例上的异常检测和定位结果，可以发现相比于 CLIP 的原始输出，经过 Grounding DINO 的定位框筛选和MMCI的多尺度交互后，FiLo 能够更加准确地定位出异常位置。

除此之外，通过查看与图像特征最相似的细粒度异常描述中的内容，我们还可以知道图像中存在的具体异常种类，为模型的判断提供了依据，提高了模型决策的可信度和可解释性。

FiLo论文已经被人工智能和多媒体领域顶级会议 ACM MM 2024 接收，论文预印版已发布于 Arxiv 上，并开源了相关代码。

研究团队认为，现有异常检测方法往往只注重判断图像中是否含有异常，而不重视异常的具体内容，通过借助大语言模型的丰富知识，后续研究可以增强异常检测方法对具体异常类型的判断，增加方法的实用性和可信度。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

洗碗机爆发在即国产品牌逐渐成为市场主流

存起火隐患松下召回4175台笔记本电脑

爱上海信H55E72A就是这么简单

人工智能遥控器就能轻轻松松帮你找到你想看的剧

中华网家电

成果速递丨ACM MM 2024：中科视语提出FiLo，实现工业场景零样本异常检测新突破

立升智矿净水器H7：以智能科技引领健康送礼潮流

@全国未来材料领域创新者！第十三届中国创新创业大赛颠覆性技术创新大赛火热报名中

全球瞩目智领未来 | 正中科技新生产基地引领拼装存储设备新飞跃

“把世界带到中心”国贸中心全球品牌发布会圆满落幕

国际顶级期刊《自然医学》发表华西医院与联影智能联合科研成果

丰镇市：庆祝中华人民共和国成立75周年全市职工书画展开幕

相关新闻

聚焦高阶购物需求，砂之船奥莱展现“松弛感”商业空间

连连数字总裁孙大利：AI赋能金融支付新纪元

第七届医联赛丨一心堂人征战戈壁，感悟传承千年的坚韧意志

衣邦人多场景适穿运动西服获评“2024年度十大类纺织创新产品”

让尊老敬老蔚然成风，一心堂药业开展一系列公益慰问活动

智己LS6震撼上市：全家挚爱的智能SUV，售价区间21.69万元至27.99万元

把握时代机遇，勇立创新潮头，益丰大药房高毅率企业奋勇前行

韵哥酒引领白酒行业变革的先锋力量

药品安全无小事，一心堂药业多措并举筑牢健康防线

“创客北京2024”创新创业大赛行业决赛、总决赛在海淀区圆满举办

家电推荐

家电图片

又一家上市药企发力美容肽了！

响应“以旧换新”政策，威能积极助推家电“焕”新，舒适采暖

智邦国际携品牌代言人刘欢，与百万合作伙伴共创数智一体化管理新高度

伯恩光学董事长林惠英荣登2024年《财富》中国最具影响力的商界女性榜单

新闻排行

从“小树苗”到“大森林” 成都...

探索新赛道哪个领域能成为家电...

2021年全球TV出货下降6.2% 面板...

巨头争相布局全屋智能市场向AI...

Mini LED市场不及预期产业陷...

海南省市场监管局抽查10批次快热...

智能化开辟产品创新边界智能坐...

中国制造主导高端冰箱进入新一...

苹果或正开发Apple Music新功能...

欧洲智能手机2021年“现状”：三...