中华网家电

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:频道首页 >产业 > 正文

作业帮亮相2025AI+研发数字峰会 展示多模态交互技术创新成果

作业帮亮相2025AI+研发数字峰会 展示多模态交互技术创新成果
2025-06-12 17:59:56 来源:今日热点网

近日,2025AI+研发数字(AiDD)峰会在上海举办,峰会以“拥抱AI 重塑研发”为主题。邀请了来自百度、阿里、腾讯、华为、作业帮等头部互联网企业,以及各大高校的一线从业者和技术专家带来最前沿的主题内容分享。作业帮资深算法专家周舒然受邀发表主题演讲,分享作业帮在多模态交互技术上的前沿探索与教育场景落地实践,现场学习氛围热烈,与会者好评如潮。

image.png

周舒然在演讲中指出,传统语音交互存在响应慢、理解偏差、体验割裂等问题,而大模型技术的发展为重塑语音交互体验提供了新的可能。从2023年开始,作业帮通过将语音识别、自然语言处理与语音生成深度融合,推出“理解-推理-生成”的多模态融合一体化解决方案,显著提升了交互效率与智能化水平。例如,作业帮研发的Instruct and Context-Awared TTS,可以结合上下文来产生更加真实、充满感情的语音合成系统,以及 LLM -Based ASR and Audio Chat,可以直接做到语音到文本的回复,能够理解用户语音情感和声音的系统。虽然这些系统尚未实现完全端到端,但已有效解决了传统语音交互的多个痛点。

2024年,作业帮进一步突破技术瓶颈,推出完全的端到端语音和流式全双工语音交互系统。通过创新的数据链路,Tokenizer设计,多模块融合以及推理优化,在保持稳定的聊天能力同时,将首次响应时间(TTFT)和首次语音生成时间(TTFS)大幅缩短。周舒然强调,语音交互作为最自然的人机接口,未来将成为Kernel级应用。作业帮将持续投入Voice-Agent技术研发,推动其与教育内容的深度融合,为师生创造更智能、高效的学习体验。

image.png

目前,作业帮的多模态交互技术已在多个产品中实现规模化应用。以教育行业Top1的快对AI为例,这款DAU超1200万的App已完成全面AI化改造,其中全新推出的AI口语老师方案通过多模态能力实现动态对话教学、智能纠错和联想互动,有效帮助学生突破“哑巴英语”困境,在沉浸式体验中提升语言能力。

周舒然表示,我们一直坚信语音是人类与技术交互最自然、最高效的接口,也是人与设备之间最直观的沟通方式, 未来是可以作为Kernel级别的应用来存在。未来通过Voice-Agent的能力,语音交互将继续成为无所不在的能力。在教育领域,Voice-Agent和丰富的学习内容互动,已经逐渐有明确的落地和PMF场景,我们也会持续投入,致力于提供更好的学习体验。


责任编辑:kj005

文章投诉热线:157 3889 8464  投诉邮箱:7983347 16@qq.com

关键词:

碳信用质量迷雾如何破?壳牌研讨会揭晓企业脱碳关键防线

2025-06-11 15:07:17碳信用质量迷雾如何破?壳牌研讨会揭晓企业脱碳关键防线

咖啡自由咖啡机,以商用科技重塑家庭咖啡体验

2025-06-10 16:33:46咖啡自由咖啡机,以商用科技重塑家庭咖啡体验

金色童年诗三首

2025-06-10 15:36:40金色童年诗三首

份额80%!天正配套中标中国电信大型集采项目

2025-06-09 18:13:53份额80%!天正配套中标中国电信大型集采项目

走出实验室:他们用光谱解锁工业环保执法新维度

2025-06-09 17:17:05走出实验室:他们用光谱解锁工业环保执法新维度

百余专家122场硬核报告!第六届世界激光制造大会深圳开幕!

2025-06-06 11:46:41百余专家122场硬核报告!第六届世界激光制造大会深圳开幕!

相关新闻