在刚刚落幕的2022世界人工智能大会(WAIC)中,上海蜜度信息技术有限公司不仅与上海市人工智能行业协会主办了“数据智能与内容认知高峰论坛”,邀请数据智能领域的国内外顶级学者共同深度探讨了技术演进与未来愿景;在展览活动中更通过“蜜小智”“蜜小度”“蜜小校”等虚拟形象,带领观众沉浸式地感受了跨模态信息检索与智能校对两大数据智能应用在具体场景中的赋能。
作为蜜度以强大科研能力与深邃行业洞察研发的两大创新应用,跨模态信息检索和智能校对能够成为深化数据价值和提升工作效率的重要途径。基于两者的多场景数据智能产品和解决方案,也已经为不同行业用户提供了从数据融合到智能认知、从策略生成到自动处理的全流程服务,全面助力政府及企业的数智化转型升级。
跨模态检索:汇集湍流,觅取一瓢
人类活动伴随着信息的产生与散播,而随着技术的进阶,信息的模态也从单一文本向多模态发展,包括图片、音频和视频在内的多模态信息占比越来越大。而当湍流般的庞杂讯息喷涌而至,跨越模态的检索能帮助我们更接近我们寻觅的答案。
在技术角度,跨模态的实现主要依赖以下四个层面的技术:
一是跨模态对比学习,指首先从单模态数据中的相似性排序进行数据增强,再使用对应特征计算对比学习损失,最终使模型在多模态任务中的表现更为出色。
二是跨模态语义融合,指通过整合不同模态间的模型和特征,提高理解能力与效率,实现对语音文字文本的自动纠错,提升识别准确率。
三是跨模态语义表征,指整合多模态信息,并对表征进行联合,从而实现视频内容的一体化识别。
四是跨模态语义检索,指通过用搜索特征向量对海量目标高维向量进行近似最近邻计算,实现语义检索及TopN相似结果的召回,最终提高检索结果的精度。
秉承高效而全面的跨模态检索能力,蜜度旗下跨模态检索平台“蜜度索骥”在保障了文本判读与图片识别准确率的同时,还能够智能识别图片中的文字内容,准确解析视频中的字幕、背景、封面等特征元素。
对模型的细节优化同样步履不停,目前,蜜度索骥已实现对常规常见场景的快速识别与提取,并针对一百余个政务类单位、近300个特殊场景进行加强训练,实现特殊场景识别;并通过智能识别能力输出视觉、语音多维度内容标签,进一步提高检索效率。
目前,蜜度旗下的蜜度索骥、蜜度版权通、城感通等产品已经植入了先进的跨模态检索能力,为社会治理、网络安全、版权保护、品牌决策、营销洞察等场景打造了标杆化应用。
除了各种场景化应用之外,跨模态检索的发展也为AIGC(AI Generated Content,人工智能自主生成内容)带来了前所未有的势能。一个极好的例子就是正在迅猛发展中的AI绘画——借助大模型的跨模态综合技术能力,人工智能可以通过表征学习将图像、视频、音频、语义等多模态信息融合,再佐以跨模态数据的协同训练,最终让抽象的自然语言可以经由预训练模型自动完成视觉图像的自动生成。
蜜度AI小画家“蜜小度”绘制作品
随着人工智能技术的全局发展,跨模态检索提升的不仅是搜索效率与结果质量,同样也帮助我们突破人脑的创意限制,用贴切的想象力营建更精彩的未来世界。
智能校对:一目万行,纤悉无遗
蜜度在智能校对应用能力通过结合行业先进的自然语言处理、知识图谱与光学字符识别等技术,实现了对中文文本和语义关系错误的自动发现与纠正处理,可广泛应用于政府公文、新闻稿件、日常写作等场景,在降低差错概率和提升文本质量的同时,也大幅度提高工作效率。
在技术角度,智能校对的实现主要有以下特点:
一是基于“大数据+大模型”,百亿级别的平衡语料,实现细微语义信息的捕捉、辨别。
二是专用校对知识图谱,以知识图谱技术驱动,刻画人物、机构、地域等实体关系,实现时政相关表述校对,让字符串拥有关联语义。
三是专业领域校对赋能,通过集成学习技术,能够快速形成不同行业的校对能力。
蜜度旗下AI智能校对平台“蜜度校对通”就是基于智能校对应用而开发的专业软件。蜜度校对通围绕中文语言特点及使用习惯,以百亿级训练语料为基础,覆盖文字标点差错、知识性差错、内容导向风险三大审核与校对类型,并拥有25类全栈审核与校对能力,能够对错别字、词,多字、少字错误,语义重复,语序错误,句式杂糅,量与单位差错;专有名词及术语,法律法规名称,常识差错等内容进行智能审核与校对,有效解决内容的规范性、安全性、合法性问题。
无论是政务单位的日常公文、思想汇报、宣传稿、工作总结等材料;还是图书、期刊、科研报告、论文、媒体通稿、专题报道等文稿;抑或音像电子、网络游戏等电子出版物;以及企业软文、品宣物料、策划案等内容,都可以由蜜度校对通执行快速错敏校对,一站式全方位地提高内容质量,保障内容安全。
AI智能校对平台——蜜度校对通
就在此次2022世界人工智能大会(WAIC)现场,软硬件本地化智能解决方案——校对通AI-Box也正式发布,作为首个通过华为昇腾AI生态认证的本地化智能校对解决方案,校对通AI-Box既可以在本地化的部署下,充分保障数据私密性;也能够作为专属的边缘计算,大幅度提升用户工作效率;同时也在融入华为昇腾 AI 生态体系的过程中,与主流国产系统共同营造高质量的数字办公体验。
对数据最好的尊重是智能化地挖掘它们蕴藏的价值,而在此过程中,我们不仅可以凝集人类的过往经验用以打造更快捷的算法模型,也需要人工智能使用不同于人脑的方式感知这个世界,从而开辟一个全新的方式,不仅理解万物,也汲取能量,最终创造更精彩的未来。
人工智能是属于这个时代的强大工具,它不仅是信息检索长途上的同行者,也是重构世界的创造者,而作为数据智能领域的领军者,蜜度致力于用每一点技术进步,推动各行各业的数智化发展,与业内合作伙伴以及广大用户一同,众行致远,探索浩瀚。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com