ChatGPT乍起,掀起一场AI风潮。如今,国内各大企业如火如荼入局ChatGPT,但具体什么时候能上岗尚且还不明晰,尤其像一些艰深、壁垒性高的行业,比如医疗行业对于ChatGPT仍然不得其所。在医疗行业,云知声则通过深耕AI领域的经验,打造行业垂直版ChatGPT,为智慧医疗赋能。
千呼万唤下,医疗版ChatGPT是否可行?
在医疗行业,一位哈佛医学院教授亲自下场测试ChatGPT的表现。结果显示,它在45个案例中的39个诊断正确,正确率87%(超过了现有机器诊断率的51%);并为30个案例提供了适当的分诊建议。他表示“ChatGPT辅助诊断的表现,已经接近医生。”
既然如此,那什么时候可以上岗?系统性地梳理过复刻中国版ChatGPT背后的技术与生态难度,以及培训成本来说,直接让ChatGPT运用在医疗行业,短期内是不可能实现的相比之下,打造垂直的“医疗版ChatGPT”更有可能实现。
ChatGPT行业版的建设的难点
最新曝光的进展,智能语音赛道独角兽云知声正在推进ChatGPT行业版的建设——以医疗作为切入口,构建ChatGPT医疗行业版,同时基于ChatGPT行业版构建平台,快速扩展到其他领域,再利用领域模型集成MoE(Mixture of Experts)技术,训练得到通用ChatGPT模型。
而这种从专用到通用的思路。其实是云知声一贯的“U+X“做法。在这里,“U”指的通用大模型算法研发及高效训练底座平台;“X”则是应用于多个行业领域的专用大模型版本。事实上这也正在成为不少企业入局ChatGPT的思路,这样一来,可以利用已有的专用数据优势。
不过也不是那么容易走的,更何况云知声选择的,还是对生成内容质量要求更高的医疗行业作为切入口。
最首要的难题,是要提高医疗知识的可靠程度。ChatGPT最擅长的,就是一本正经地胡说八道。放在现在Bing上聊天搜索、内容生产其实问题不大,用户们也乐在其中。但应用在行业中,往往让非专业人士难以察觉,这会引发各种风险。因此行业版ChatGPT要杜绝一切胡说八道,尤其像医疗、教育、工业等行业,内容生成要求极高容错率很低,也对数据的质量要求也就更高了。
其次,就是实现行业中的“性价比”。任何一项技术能够大规模落地,都必须要解决「如何以有限的资源,实现效果的最大化问题。这也是ChatGPT行业落地的必经之路——模型能以更小的参数规模,达到与ChatGPT同样的效果。这也就给这些企业带来了不小难题。
云知声破解难题,赋能智慧医疗发展
面对ChatGPT行业落地的难点,云知声能否解决呢?答案是肯定的。作为在AI领域深耕10多年的独角兽企业,云知声拥有以下优势:
数据方面,近10年来云知声积累了全方位的行业数据,包括面向患者的导诊、预问诊、患者教育和随访系统,也有面向临床的语音病历,病历质控,单病种质控和医疗风险管理系统,已有近400家医院落地使用。据称数据规模已达到了5T,为医疗行业语言大模型提供数据基础。
算法方面,而ChatGPT所代表的认知智能,本身就是云知声核心技术优势。他们构建了国内最大的医疗知识图谱之一。从2019年至2022年,云知声的认知智能技术在国内外相关评测中荣获7冠5亚。其自主研发的医疗预训练语言模型CirBERTa一度登顶中文医疗信息处理挑战榜榜首。
在算力上,云知声超算平台浮点计算能力可达8亿亿次/秒,可为千亿级参数规模模型提供算力保障。
而在大模型工程化方面,云知声已经研发了CirBERTa模型,复现了GPT-2模型,并利用模型压缩和知识蒸馏机制,实现了线上推理效率的近百倍加速,为大模型的广泛应用奠定了基础。
而在内容质量保障上,云知声利用应用在CirBERTa的持续学习和知识嵌入技术,基于已有知识图谱积累,优化ChatGPT模型的知识获取和更新机制。这样一来可以保证ChatGPT回答中的知识正确性,与此同时还可以给出知识溯源信息。另外,利用云知声业内领先的病历质控技术,可以自动发现生成的病历中的问题,进而自动生成作为ChatGPT核心技术的基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)所需的用户反馈数据,加速模型的优化!
上一次AI浪潮来袭时,人们感叹AI技术初步显示其巨大发展潜力,观望者居多,云知声悄然入局,默默耕耘。而随着ChatGPT直接以技术路径出现,再次掀起了AI浪潮,诸多企业纷纷入局。在此背景下,云知声则依据企业既定目标,行稳致远,依托企业优势,赋能医疗行业向好发展。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com