2025年3月21日,应北京大学信息工程学院副院长杨玉超教授的邀请,IBM Research-Zürich laboratory的Abbas Rahimi研究员通过线上论坛的方式,开展了主题为“Toward Reliable and Cost-effective Compound AI Systems”的演讲,与北京大学的师生展开了线上、线下结合的深入交流。此次参会的人员包括信息工程学院副院长杨玉超教授、焦海龙长聘副教授、苏钰淇助理教授及其他北京大学教师、博士后、博士和硕士研究生等40余人。
主讲人Abbas Rahimi,2010年在德黑兰大学获得计算机工程学士学位,2015年在加州大学圣地亚哥分校获得计算机科学与工程硕士和博士学位,随后在加州大学伯克利分校和苏黎世联邦理工学院担任博士后。2020年,他作为研究员加入IBM Research-Zürich实验室。2015年获得欧洲设计与自动化协会“嵌入式系统设计与嵌入式软件新方向”领域优秀论文奖,2017年获得ETH Zürich博士后奖学金,他是DAC(2013)和DATE(2019)的最佳论文提名的共同获得者,同时还是BICT (2017), BioCAS(2018)和IBM的Pat Goldberg Memorial(2020)的最佳论文奖的共同获得者。
当今人工智能的进步无疑是令人印象深刻的,然而,即使在计算和能源需求飙升的情况下,现代人工智能解决方案在面对非分布数据时仍然步履蹒跚。这一挑战要求范式转变,特别是对于功率受限、安全关键型应用。为了解决这个问题,Abbas Rahimi研究员展示了如何设计复合人工智能系统在优化成本和可扩展性的同时确保可靠的运行。这些系统通过强大的工具和外部验证器无缝地协调神经网络,实现高度集成和统一的神经符号计算和接口,从而降低成本并提高可扩展性。至关重要的是,复合人工智能系统的实现得益于新兴硬件技术的非常规物理特性,即利用存内计算。这种协同作用释放了强大的计算原语,使复合人工智能系统在学习和复杂推理方面表现出色,即使在非分布条件下,也具有前所未有的计算和能源效率。
Abbas Rahimi研究员的报告围绕四个主题展开:
(1)采用基于时间复杂度为(O(1))的矩阵向量乘存算核加速Transformer大模型;
(2)在具有高稀疏激活的动态系统中引入随机特性,优化系统收敛速度与面积开销;
(3)在连续向量空间中实现高可靠推理,并构建与神经网络相兼容的软硬件系统;
(4)回顾System1在长度可泛化状态跟踪中的表达能力。
论坛中,杨玉超教授、焦海龙长聘副教授、苏钰淇助理教授以及线上线下师生与Abbas Rahimi研究员在相变存储器电导漂移特性、存储器选择与动态系统随机性等方面进行了讨论与交流。
图1杨玉超教授同Abbas Rahimi研究员展开探讨
图2线下参会同学踊跃提问
图3线上参会人员与Abbas Rahimi研究员展开互动
论坛最后,全场线上线下师生再次对Abbas Rahimi研究员的精彩演讲表示感谢,并邀请他有机会来北京大学深圳研究生院进行线下交流和互动。