中华网家电

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:频道首页 > 快讯 > 正文

首次商用试运行,类脑智算集群支持大模型快速推理服务

首次商用试运行,类脑智算集群支持大模型快速推理服务
2025-08-14 15:44:23 来源:看点时报

据悉,“杭州灵汐类脑智算集群”已于7月底实现了大模型快速推理API的企业服务试运行。该集群由杭州灵汐类脑科技有限公司牵头搭建运营,中国电信、中国电子科技南湖研究院以及脑启社区作为合作方参与,由杭州电信具体承担集成建设。该集群部署在中国电信杭州智算中心,算力规模超200POPS。这也是类脑智算集群在全球范围内,首次以支持大模型快速推理的方式,走向商用试运行。

作为类脑智能技术的创新应用成果,该智算集群具有”存算一体、众核并行、稀疏计算、事件驱动”的特性,可显著提升计算效率、大幅降低能耗,实现大语言模型推理的 “一快、一低、一降” :一是推理速度快,单用户的推理延迟控制在毫秒级别,速度性能相对于传统方案有明显优势(可流畅响应实时交互及长本文深度推理),告别卡顿;二是首token延迟低,可降至百毫秒乃至十毫秒级;三是智算集群的功耗大幅下降,较业界同等推理算力水平可降低功耗二分之一至三分之二以上。异构融合类脑芯片具有兼容PyTorch框架的类CUDA软件栈,可直接服务于多类开源大模型的快速推理、而不需要转换类脑算法。

图1 灵汐智算平台大模型登录

图2 灵汐智算平台大模型快速推理

当前,大模型推理普遍存在吞吐速度慢(每秒十到几十词输出)和高延迟问题(常常超过1秒甚至数秒),对众多行业场景构成了制约。在此背景下,灵汐科技基于类脑智能技术给出了“高实时、高吞吐、低延迟“的推理服务解决方案,将在金融应用、情感陪聊、快速导览、大规模数据标注以及无人机实时航拍处理、灾害预警与应急处置等领域场景逐步落地。据介绍,该智算集群(中心)将持续升级,新一代类脑智算高密度计算平台也将在近期正式发布推出,集群能效比预计将进一步提升。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj015

文章投诉热线:157 3889 8464  投诉邮箱:7983347 16@qq.com

关键词:

怎么挑选儿童奶粉?这份攻略请收好!

2025-08-14 15:17:37怎么挑选儿童奶粉?这份攻略请收好!

2025机器人装箱机厂家五大推荐榜单:权威测评解析与市场口碑

2025-08-14 15:10:072025机器人装箱机厂家五大推荐榜单:权威测评解析与市场口碑

A股上市公司年报盘点,是“鸡肋”还是“利器”?

2025-08-14 14:52:58A股上市公司年报盘点,是“鸡肋”还是“利器”?

讲述英雄故事 传承红色记忆丨福寿园国际集团发起“时光对话·致敬不朽”主题作品征集活动

2025-08-14 14:49:21讲述英雄故事 传承红色记忆丨福寿园国际集团发起“时光对话·致敬不朽”主题作品征集活动

送长辈什么礼物最实用?这十款保健品NMN、益生菌等品牌推荐指南

2025-08-14 14:48:56送长辈什么礼物最实用?这十款保健品NMN、益生菌等品牌推荐指南

2025自动绕线机生产厂家推荐昆山鑫恒玥 工程案例遍布全国超可靠

2025-08-14 14:27:172025自动绕线机生产厂家推荐昆山鑫恒玥 工程案例遍布全国超可靠

相关新闻