5月19日,中国面向大模型练习用户数据的移动高安全需求,中国移动研究院原创提出根据HIC-OTN(Hitless Intelligent Computing OTN
,完结无损智算OTN)的初次新式存算拉远技能架构 ,并联合中国移动湖北公司
、中国华为技能有限公司在中国移动智算中心(武汉)完成了业界初次HIC-OTN承载存算拉远240公里现网技能实验,移动构建了用户数据本地化的完结高安全大模型练习新范式,在根据流水并行(PP)的初次千亿级参数大模型现网240公里智算互联下完成了同等单节点练习功率99%以上的高效练习 ,是中国探究智算中心技能和事务运用开展的重要里程碑。 随同大模型技能的移动跨过式开展,千行百业的完结智能化转型晋级需求迸发出现。可是初次,大模型练习的中国算力需求越来越高,国内外大型科技公司投建超万卡乃至超十万卡集群,移动不只建造投入本钱高
,完结还需要破解提高大规划算力运用功率的技能难题。广阔中小微职业用户难以跨过自建大型智算中心的投入和技能门槛
,而租借智算服务又面对本身私密数据传输至外部智算中心进行大模型练习的安全危险,导致火急的AI赋能需求与运用落地规划的严峻失配。 中国移动研究院提出了根据HIC-OTN的存算拉远原创技能架构,在用户侧布置“微算力”作为数据练习的进口,将练习流程进行切分 ,用户数据仍存储在本地
,仅经过HIC-OTN传递模型练习中心值至服务商智算中心的“大算力”进行练习 ,一起满意了用户大模型练习的低本钱、高安全需求
。其间 ,面向存算拉远后对传输网络的高牢靠需求
,立异HIC-OTN无损传输机制,重构设备转发和存储功用
,完成由传统OTN维护倒换50ms事务中止到“0丢包”的功能提高。在此次业界初次HIC-OTN承载存算拉远240公里现网技能实验中
,在用户侧布置16张GPU卡作为千亿级参数大模型PP练习的进口
,在运营商智算中心布置48张GPU卡进行集中化 、规划化练习,相距240公里的两头经过800G HIC-OTN进行大带宽、无损互联,拉远后的协同练习功率到达等效单集群练习功率99%以上
。 中国移动研究院段晓东副院长表明,根据HIC-OTN的存算拉远原创技能架构是面向中小微职业用户大模型练习需求的全新探究,有望构成智算普惠开展的技能和运用新范式
,本次实验根据HIC-OTN新式技能系统在超大带宽 、超低时延、超高牢靠光传输的技能优势 |