雷石产业观察：机器学习与大模型，人工智能赛道上的明珠

2022-10-25 17:26:34 来源：壹点网

小大

军事APP 头条APP

如今，人工智能已经深入到社会的方方面面，渗透到每个人的日常生活，从自动驾驶到人脸识别，再到机器翻译。

然而，大家似乎只知人工智能，却少有人了解机器学习。其实，人工智能得到广泛应用，其底层基石正是机器学习。

绝大多数涉足人工智能的公司，无论是提供解决方案的科技公司，还是应用人工智能的行业用户，都会把机器学习作为其主要业务领域之一。

未来，随着人工智能的社会普及和行业深入，机器学习在产业界的重要性会得到进一步加强。在新兴的大模型领域，会有机会涌现出一批科技创新企业，成为人工智能赛道上真正的明珠。

机器学习是人工智能的基石

机器学习就是让计算机来模拟人类的学习行为，是人工智能的核心，是使计算机具有智能的根本途径。

机器学习具有两个典型的过程，一是训练，二是推理。这两个过程，都需要大量的算力作为保障，尤其是“训练”，不仅需要庞大的AI算力，往往还需要海量的数据。

机器学习的训练和推理，相当于人类的学习和工作。其中训练的过程尤其重要，就像人类要通过16-20年的漫长学习才能具备工作能力一样。训练的结果则是“模型”，类似于人类的知识。而推理的过程则是把模型(知识)，应用到实践工作中。

以自动驾驶为例。自动驾驶汽车上都安装了很多摄像头和传感器，用于探测路况。根据采集到的视频等数据，做出判断之后，决定下一步操作：转弯、并线、加速、减速等。这个过程就是推理，推理依赖的不仅是实时采集到的数据，更需要使用训练产生的模型。

训练的工作是在推理之前完成的。自动驾驶公司要进行数十万，甚至上百万公里的实际道路学习。对于测试中获得的图片和影像数据，通过人工等标注方式，告诉计算机什么是路人、什么是车道、什么是限速牌等等。计算机需要通过各种算法对数据进行分析，最后形成了模型，被装载到自动驾驶汽车上。

目前，机器学习被普遍采用的部署方式是：在云侧进行训练，因为需要大量的数据和算力;在边侧或者端侧进行推理，因为需要低时延和贴近应用。

机器学习的不同实现方式

当前，人工智能的主要处理对象是自然语言、图片、视频等，从这些数据中提取信息，进行处理分析，并加以理解，最终落地实际应用。机器学习的对象，也正是这些数据。如何从数据中获得知识，一直是科学界和产业界共同努力的方向。

在机器学习的训练过程中，算法至关重要，有决策树算法、朴素贝叶斯算法、随机森林算法、神经网络算法等等。但这些是科学家们需要努力攻关的，对于产业界而言，更为关注的是机器学习的实现方法。

按照训练(学习)方式的不同，机器学习通常可以分为监督学习、非监督学习和强化学习三大类。

监督学习，也被称为有导师的学习，如同老师教学生一样。在监督学习过程中，训练的每个示例都是要有标注的，就像上面提到的自动驾驶实际道路学习一样。监督学习依赖于高质量的数据，包括数据的质和量。质——必须准确，否则计算机就会学到错误的知识，导致推理出错;量——要覆盖到实际道路的所有情况，否则计算机就不知道该如何应对该情况。

非监督学习，即没有导师的学习，训练的数据不需要做标记，减少了人工做数据标识的工作量，而且能够覆盖人想象不到的情况。比如在AI工业质检中，可能的产品缺陷种类太多，人工很难穷举。非监督学习的实现难度更大，是机器学习的未来发展方向。

强化学习也叫增强学习，其训练过程不需要数据，而是通过特定环境中一系列行为的后果进行学习。强化学习输入的是环境反馈，即奖惩信号，类似于马戏团的动物训练过程。

此外，深度学习和联邦学习，也是机器学习正在快速兴起的两个分支。前者已经在AlphaGo上得到成功实践，后者则由于数据安全的要求而随着隐私计算得到应用。

迅速壮大的行业应用市场

市场研究公司IDC的预测数据显示，未来五年，全球人工智能IT投资规模的年复合增长率约为26.5%;到2026年，中国市场的规模有望达到266.9亿美元，全球占比约为8.9%，位列全球第二。

在这个快速增长的市场中，机器学习算力、机器学习开发平台、机器学习行业应用，将占据非常重要的组成部分。

在算力层面，除了专业的芯片公司，很多科技公司也在开发用于机器学习的芯片。比如，华为的昇腾芯片、AWS的训练芯片Trainium和推理芯片Inferentia、阿里云的推理芯片含光800等。

人工智能应用要想落地，还必须要有机器学习开发平台的支持，这是一个面向开发者、数据科学家、业务分析师的PaaS平台。目前，机器学习开发平台的提供商大致有两类，一类是云服务商，比如AWS的SageMaker、华为云的ModelArts等;另外一类是专业的人工智能公司，比如第四范式的Sage Platform、九章云极的DataCanvas等。

在应用层面，随着越来越多的企业开始数字化转型以及智能化升级，机器学习在行业市场得到了广泛应用，为人工智能赋能产业提供助力。除了人脸识别、自动驾驶、机器翻译等消费级应用，工业质检、新药开发、金融风险评估等企业级应用，也越来越多。

制造行业的AI视觉质量检测，是机器学习最成熟的应用场景之一。IDC预计，到2025年中国工业AI质检整体市场将达到62亿元，年均复合增长率为28.5%。中科创达在Amazon SageMaker之上构建了创达智慧视觉检测系统，帮助某面板制造企业取代人工质检，检测时间从3.5秒降低到0.1秒，准确率从85%提升到99%。

另外比如蛋白质结构研究，是生命科学领域的基础问题。深势科技与阿里云机器学习 PAI 团队合作，通过全新的蛋白质结构预测推理加速方案FoldAcc，结合深势Uni-Fold最新模型代码和参数，将单次预测能支持的最大氨基酸序列长度提升至6.6k，覆盖99.992%已知的蛋白序列。

无论是机器学习的行业应用还是通用应用，未来都会有更多的科技创新企业涉足其中。这也对其提出了更高的要求——既要懂前沿的AI科技，也要有深度的行业洞察，两者缺一不可。

正在快速兴起的大模型市场

从机器学习的实现方式可以看出，“模型”是机器学习的关键环节，它是“训练”的结果，也是“推理”的基础。要得到一个好的模型，需要海量的高品质数据，也需要海量的算力支持，可谓成本高昂。

一方面是模型训练的投资巨大，另一方面是每个行业应用都是差异化的，这就导致需要重复进行大量的模型训练，使得机器学习的成本居高不下，阻碍了行业应用的普及。

大模型的概念，由此而快速兴起。国内一些头部科技公司亦涉足其中，比如华为的盘古和百度的飞桨等。

大模型更准确的叫法应该是基础模型，是大规模预训练的结果，因为有着多达千亿甚至上万亿的参数，而被称为大模型或者超大模型。

大模型被称为规模化生产高性能机器学习模型的生产线：通过提炼各大领域的共性来进行大规模预训练，生产出标准化的基础大模型;然后再根据各个行业不同的共性需求，训练出行业预训练大模型;最后根据具体应用场景的需求，通过少量定制开发形成推理模型，从而落地应用。

这样的逐级训练大模型的方式，可以最大程度降低全社会在机器学习成本上的投入，实现AI应用的规模化落地。仍以自动驾驶为例，如果每个整车厂都要从头开始做模型训练，无疑是很大的浪费，毕竟大家面临的道路情况是一样的。如果有专业第三方公司来训练和提供标准化的大模型，就可以避免重复投入。这样，既降低成本又能提升性能，使自动驾驶更快落地。

大模型市场才刚刚起步，未来发展空间很大，当然变数也很大。训练好大模型和应用好大模型，同样重要。在这两个环节上，未来或许会涌现出一批创业企业，尤其是专注于生产行业大模型的科技创新企业。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com

关键词：

洗碗机爆发在即国产品牌逐渐成为市场主流

金融科技下，金融企业如何保障信息安全

主播雨化田们再接新活，这次让网友们下载的是交管12123APP

深圳看到科技发布Kandao Meeting S 180°超广角智能视频会议机

中华网家电

雷石产业观察：机器学习与大模型，人工智能赛道上的明珠

年末肌肤大考验，可复美助力肌肤健康年复一年！

冬季肌肤问题频发怎么办？可复美胶原棒助你轻松应对

加快ICU床位周转，提高ICU收患效率

“向美而生，镜头下的这十年”摄影故事云展今日起线上展出

母亲健康快车出发！达能纽迪希亚守护母婴健康美好未来

挖掘陈年白酒独特价值，五粮液连续四年举办“家有老酒”活动

相关新闻

坚持可持续发展，爱普生连续三年获得EcoVadis铂金评级

深圳中英双语学校，在爱文学校上小学是什么样的体验

飞天诚信全速驶入海外支付新赛道，打造第二增长曲线

大连宠物火化殡葬，恋宠有佳宠物善终，给千万毛孩子一个更好的归宿

腾讯云助中国工商银行上线新一代人脸核身系统，让用户优雅“刷脸”

去雨林深处，听大象长吟，自然纪录片《寻象》正式上线！

从修车延伸"卖车"，华胜集团力拓新能源汽车业务新局

年末肌肤大考验，可复美助力肌肤健康年复一年！

创新品牌力获认可皮肤学级护肤品集团安德普泰荣获大学生活力品牌奖

津药药业子公司制剂产品通过一致性评价亿级细分市场优势扩大

家电推荐

家电图片

德国威能与南京高等职业技术学校达成深化合作

连花清瘟抢不到了，又开始抢醋了?

威能做客《来点财经范儿》，畅谈商业重塑“向往的生活”

德国威能荣获第十九届精瑞人居科学奖

新闻排行

从“小树苗”到“大森林” 成都...

探索新赛道哪个领域能成为家电...

2021年全球TV出货下降6.2% 面板...

巨头争相布局全屋智能市场向AI...

Mini LED市场不及预期产业陷...

海南省市场监管局抽查10批次快热...

智能化开辟产品创新边界智能坐...

中国制造主导高端冰箱进入新一...

苹果或正开发Apple Music新功能...

欧洲智能手机2021年“现状”：三...