·CFFF平台训练的第一个科学大尺度模型是复旦大学人工智能创新与产业研究院李浩团队研发的45亿参数的中短期天气预报大尺度模型。 培训成果已正式发布,达到国际先进水平。 在CFFF平台上,一天内可以训练45亿个参数。
CFFF平台将不断扩大算力规模,并向复旦大学以外的科研机构、大学、医院、高新技术企业开放。
部署在复旦大学的“金丝”1号和托管在1500公里之外的阿里云乌兰察布数据中心的“切文”1号,成为了真正的“超级计算机”。
6月27日,中国最大的高校云科研与智能计算平台CFFF(for the at Fudan)在复旦大学正式上线。
澎湃新闻了解到,CFFF是一台为发现和解决复杂科学问题而打造的科研“超级计算机”。 用于高端研究的专用高性能计算集群“金丝”一号由两部分组成。 据介绍,CFFF由复旦大学、阿里云、中国电信联合创建。 它在先进的公有云模型中提供超千本地并行智能计算,支持千亿参数的大规模模型训练。 这在国内高校中尚属首例。
在平台启动仪式上,中国工程院院士、阿里云创始人王健回忆起2008年刚创立阿里云时在高校的演讲。用得起超级计算,让计算发挥价值”。 15年后,CFFF平台上线,王健感觉自己当年的愿望实现了。
复旦大学校长、中科院院士金力表示,一方面,CFFF作为国内高校首个大规模异构智能计算平台,希望能为复旦大学提供更强大、更加稳定、更加灵活、高效、低成本的基础科学研究平台。 计算支持。 另一方面,希望基于CFFF平台,建设一批具有世界级影响力的科学大尺度模型,如生命科学大尺度模型、大气科学大尺度模型、材料科学大尺度模型等。大比例模型、集成电路大比例模型等
一天内训练了45亿个参数
目前,CFFF平台上的第一个科研成果已经诞生。 复旦大学人工智能创新与产业研究院李浩团队近日发布了包含45亿参数的大规模短期天气预报模型。 预测效果在公开数据集中第一。 达到了业界认可的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预报速度从原来的小时级别缩短到3秒以内。 据介绍,这个拥有45亿参数的大型模型仅用了一天的时间就训练完成。
李浩在接受澎湃新闻等媒体采访时介绍,“一是我们把预报周期延长到了15天;二是达到了欧洲中程天气预报中心的集体平均水平;三是模型采用相对数值模型的推理速度是分钟甚至秒,这也是这个人工智能模型本身的优势。”
“基于CFFF平台的千卡并行智能计算,只需要一天的时间就可以完成如此??大规模模型的训练,在传统计算平台上很难做到。” 李浩说道。
不过,李浩也表示,目前大模型取得的成果大多是统计结果。 天气预报是一个复杂的过程。 对于台风等极端天气的预报,模型需要在更多的实际场景中得到验证,也需要与行业内更多的单位和专家合作。
金力表示,未来CFFF平台将不断扩大算力规模,并向复旦大学以外的科研机构、大学、医院、高新技术企业开放。
金力认为,在数据和智能技术驱动的“大科学时代”,如何在日新月异的科技创新环境中赢得主动,在关键领域实现创新突破,是时代赋予大学的命题。 作为新兴的科学研究超级计算架构,以CFFF平台为代表的智能计算平台将成为科学研究的重要支撑力量,大幅提高科研效率,降低科研成本,加速发现科学原理和成果。技术突破,大力推进科学研究。 模型落地。
据复旦大学介绍,CFFF平台自建设第一天起,就收到了复旦大学不同院系的多种研究需求,不仅涵盖生命科学、大气科学、材料科学,还涉及金融体系等社会科学领域。分析。 研究。 平台上的云原生、低代码工程AI开发平台,进一步降低了AI与科研融合的门槛。
27日,首届面向全球研究人员的“世界科学智力竞赛”正式启动。 比赛设置了生命科学、量子化学等五个主要赛道。 算力长期支持一些科研项目。
复旦四校区所有实验设备均可高速互联
从具体技术来看,部署在复旦大学的“金丝”1号和托管在1500公里之外的阿里云乌兰察布数据中心的“切文”1号已经成为真正的“超级计算机”。 。 100G高速数据传输网络和阿里云大规模异构算力融合调度技术、分层存储技术、人工智能与大数据融合技术,实现复旦大学四个校区所有实验设备的高速接入,实现异构算力统一管理、计算任务统一调度,满足不同应用场景下科学化、智能化研究和应用的需求。 位于“东数据、西计算”节点的阿里云乌兰察布数据中心,采用公有云模式,为复旦大学计算多个学院的多个科研项目提供更高性能、更灵活、更低成本、更绿色智能服务。
复旦大学教授、人工智能创新与产业研究院院长齐源表示,得益于公有云模式,运行在CFFF平台上的项目可以享受超大卡并行智能算力,以及有效算力千卡并行算力达到业界领先的92%,扩展性达到万卡,万卡并行有效算力可达90%。
此外,据复旦大学介绍,CFFF平台还拥有国内高校最大的多级数据冷热分层存储集群,解决了海量科研数据无法长期备份的痛点,支持云端高速传输。 过去,PB级科研数据从复旦大学传输到西部数据中心需要两周时间,现在一天即可完成,真正实现了“从东到西数”。
高校与企业如何合作?
启动仪式结束后,金力、王健接受了媒体采访。 谈及阿里云与复旦大学的合作,王健、金立军表示,企业与高校的合作不应局限于产学研科技成果转化,而应视为联合创新以及企业与大学联合培养。 人才活动。
王健表示,高校与企业的合作不仅仅是高校向企业转移研究成果的简单关系,而是可以创造更多的东西。 回顾历史,IBM与哥伦比亚大学的合作催生了计算机专业,MIT与贝尔实验室的合作催生了通信专业。 阿里云与复旦大学的合作也将在未来创造更多新的机遇。 王健还提到,利用GPU(图形处理单元)进行AI计算的方法最早是由高校师生使用,但业界后来将这种方法大规模化,使得高校与业界的创新有了更好的联动。
金力表示,科学技术的快速发展给高校如何培养学生带来了巨大挑战。 一方面是跨学科的融合,另一方面新技术不断涌现。 因此,产教融合非常重要。 “这种产教融合不是简单的技术转移模式,而是大学与企业在创新、人才培养等方面的紧密互动。创新不是简单地为企业解决一项技术,而是处于优势地位。” “在国际竞争中的地位。在人才培养方面,企业更多地可以看到社会的进步,因此也可以看到高校人才培养的目标和方向。”
金力还从复旦大学的角度对新一代工程师的培养提出了新的观点。 他说:“中国发展到现在,除了量的角度,还有质的角度,就是我们不仅要培养更多的工程师。更多的工程师,还要培养优秀的工程师。” ”。
“很多人以为复旦大学文科好,后来发现我们理科也不错,但复旦大学工科没有优势。” 金力坦言,“原来传统工程更注重利用成熟的技术和材料进行工程实现,总是强调高端、前端,但从工业角度来看,这些东西都没用。现在我们强调在工程中实现原有的东西,希望把无用的东西变成有用的东西,这就是传统工程和新工程的区别。”