首页 · 杭研印象 · 研在杭研 · 正文
责任编辑 审核人

AI技术的飞速发展已经深刻改变了我们的世界,特别是在大模型(Large Models)的演进方面,其速度之快令人瞩目。为帮助同学们增进对AI领域大模型的了解,加深对其技术和应用领域等方面的认识,5月18日,先进视觉研究所举办第五期“学术沙龙”活动。

活动由先进视觉研究所邵晓鹏团队主办,团队特别邀请百度系统部资深网络架构负责人朱宸博士,带来题为“AI时代的大数据中心-面向AI的数据中心网络演进”的报告,带领同学们进入AI大模型的研究领域,研究所30余名同学参加讲座。

“随着计算能力的提升和大数据的积累,AI大模型的参数规模从最初的数百万到现在的数十亿、数百亿甚至上千亿,呈现指数级增长。”朱宸首先以OpenAI的GPT-3为例,阐述介绍大模型带来的革命性变化,他介绍,这一变革使模型能够处理更加复杂、精细任务,同时还具备更高的性能。

紧接着,朱宸介绍大模型在提升通用性方面的作用和大模型训练中面临的技术挑战。在实现高性能计算方面,朱宸博士重点介绍了英伟达的多节点NVLink网络总线技术和RDMA大规模网络技术,通过二者之间的对比,介绍了两种技术的特点和应用场景,指明NVLink网络总线技术未来发展的方向与其无限的可能性。最后,朱宸博士结合大模型的特点认为其未来可能会向全光互联的方向演进,打破系统级互联空白,在链路级互联稳步演进。

报告结束后,朱宸和同学就大模型技术难点、求职经验进行交流。朱宸鼓励同学们持续学习新知识,提高筛选和识别能力,为今后的学习和工作打下良好基础。

本次“学术沙龙”活动,不仅帮助同学们深入理解了AI领域前沿技术,也为同学们提供了深入了解相关行业的机会。接下来,先进视觉研究所将继续依托“学术沙龙”系列活动,持续策划形式多样、内涵丰富的学术活动,提升同学们的科研素养和创新实践能力,为他们打造更加宽广的学术视野和成长空间。(通讯员:安思懿)

主讲人介绍:

朱宸,于2014年在墨尔本大学获得博士学位,现于百度系统部担任资深网络架构负责人以及技术委员会主席,曾经在诺基亚贝尔实验室、英飞朗海底光通信部门和亚马逊Kuiper就职。于国际会议和期刊发表论文80余篇,研究方向为长距高速相干光通信、短距、片间超高速互连芯片以及系统,AI网络架构以及应用。

上一篇:2024届毕业生风采展播 | 戴初一:知行合一,笃行致远

下一篇:筑梦时间丨杭州研究院举办大模型专题专家讲座