ACM China 新星论坛

时间:2026年7月11日 地点:杭州黄龙饭店
时间 环节 内容/报告题目 讲者 主持人
14:00-14:30 报告 从系统创新到顶会论文:大模型时代 AI Infra 的系统性挑战与突破 翟恩南
(阿里巴巴通义大模型事业部)
张兰
(中国科学技术大学)
14:30-15:00 报告 Edit Banana:将非结构化图像转化为结构化可编辑形态 柴成亮
(北京理工大学)
张兰
(中国科学技术大学)
15:00-15:30 报告 构建具身进化智能体:一种连接多模态大模型与世界模型的类脑范式 高君宇
(中国科学院自动化研究所)
张兰
(中国科学技术大学)
15:30-16:00 报告 探索视觉感知新范式:基于摩尔纹的超高精度微状态感知 宁静仪
(南京大学)
张兰
(中国科学技术大学)
16:00-16:30 报告 智能图像视频编码 李礼
(中国科学技术大学)
张兰
(中国科学技术大学)
16:30-17:00 报告 环境即智能:物理 AI 研究的范式转移与关键挑战 封硕
(清华大学)
张兰
(中国科学技术大学)



ACM China 新星奖

为表彰中国计算机领域的青年学者所取得的研究成绩,并进一步推动青年学者在科研领域的发展和进步,从2014年起,ACM中国理事会设立ACM中国新星奖,每年评选出1-2名在计算机领域展现出突出科研潜力的青年学者为获奖者。该奖的选拔是基于候选者在计算机和(或)通信系统相关领域内,所创建的新的理念、模式、和新的系统等研究成果产生的影响,研究成果可以是理论、经验或实验方面的。深度和影响力都是评奖所考虑的重要因素。获奖者同时会获得1万人民币的奖励。颁奖仪式会在每年召开的ACM中国图灵大会期间举行。


ACM China 优秀博士论文奖

ACM中国优秀博士论文奖为表彰在计算机科学和工程领域,由中国的学术机构授予的,最优秀的博士论文而设立,以鼓励获奖者所做的专注的研究,以及取得的学术成就。从2014年开始,ACM中国优秀博士论文奖每年会颁发给1-2篇获得认可,并且影响力大的博士论文的作者,获奖者同时会获得1万人民币的奖励。颁奖仪式会在每年召开的ACM中国图灵大会期间举行。



报告题目:从系统创新到顶会论文:大模型时代 AI Infra 的系统性挑战与突破

翟恩南

阿里巴巴通义大模型事业部,正高级工程师

摘要: 大模型时代,AI Infra 正面临前所未有的系统性挑战。本次报告将从通义大模型 Infra 的视角,介绍近五年团队在训练可靠性、推理服务效率、跨任务调度与 集合通信合成等方向的一系列工作。这些工作已规模化支撑通义各类模型的训练与服务,并发表于 SIGCOMM、OSDI、NSDI、SOSP 等系统顶级会议。报告将重 点剖析三项代表性成果:Crux(SIGCOMM'24)首次将多任务通信调度锚定到“最大化 GPU 利用率”,以 GPU Intensity 驱动路径选择与优先级分配,在生产 集群中进一步提升 GPU 利用率最高 23%,获 SIGCOMM'24 最佳论文提名奖;SyCCL(SIGCOMM'25)以拓扑与集合通信的对称性为切入点,用 Sketch 抽象将 大规模 schedule 合成从小时级压缩到分钟级,集合通信带宽较 NCCL 最高提升 108%;EROICA(NSDI'26)作为大模型训练在线 profiling 级诊断系统,已 在十万级 GPU 集群稳定运行多年,疑难性能问题根因定位成功率达 97.5%。最后,报告将结合个人经验,分享系统与网络领域顶会论文发表经验,以及工业界对 产学研协同与人才培养的思考。.

个人简介: 翟恩南,阿里巴巴通义大模型事业部正高级工程师,国家级人才。2015 年于美国耶鲁大学计算机系获博士学位,随后担任耶鲁大学研究型助理教授,2018 年加入 阿里巴巴。研究领域包括人工智能与分布式系统等,在相关领域发表国际顶级会议/期刊论文 80 余篇,近五年在计算机网络两大国际顶会 SIGCOMM 和 NSDI 发表 论文总数全球第一。常年担任 SIGCOMM、NSDI 等国际顶级网络系统学术会议程序委员会委员。曾获中国电子学会青年科学家奖、中国电子学会技术发明一等奖、中 国通信学会技术发明一等奖、SIGCOMM 2024 最佳论文提名奖、观察者网年度科创人物等奖项。.

报告题目:Edit Banana:将非结构化图像转化为结构化可编辑形态

柴成亮

北京理工大学,预聘副教授

摘要:本报告介绍一种面向专业办公与创作场景的 AI 视觉内容解析平台。该平台聚焦科研、白领及设计群体,针对科研绘图、商业图表及 PPT 等静态图像“看得见、改不了”的痛点,通过智能处理将其转化为可编辑的数字资产,有效破解传统人工重绘耗时、主流生图模型不可编辑的局限。 平台依托三大核心技术创新:一是模型感知的数据飞轮技术,构建可控数据生成体系,通过能力感知与难例聚焦重点学习,形成训练、感知、 增强、回流、优化的闭环机制;二是多模态大模型的图层分解技术,在统一框架内联合实现图层分离、元素重建与页面重构,输出 SVG、PPT 等可编辑格式;三是多模态大模型的可编辑图像生成技术,基于分层数据微调模型,实现从自然语言直接生成可复用分层视觉内容。项目落地将进 一步激活静态图像资产价值,重塑专业视觉生产力。

个人简介: 柴成亮,北京理工大学计算机学院预聘副教授、博士生导师。主要研究方向为面向人工智能的数据准备、基于大模型的数据智能分析等前沿方向。 目前已发表 CCF A 类论文近 40 篇,包括 SIGMOD、VLDB、ICDE、KDD、TKDE 和 VLDBJ 等。曾获 ACM 中国新星、CCF 优秀博士论文奖、 ACM 中国优秀博士论文奖,并入选福布斯中国 30 位 30 岁以下精英等。主持国家自然科学基金联合重点、面上等项目。

报告题目:构建具身进化智能体:一种连接多模态大模型与世界模型的类脑范式

高君宇

中国科学院自动化研究所,副研究员

摘要: 当前,构建能够在多样且动态环境中稳定运行的具身智能体仍面临诸多挑战,例如如何处理部分可观测性以及如何提升对环境变化的适应能力。受人类大脑左右半球功能分区机制的启发,本报告提出一种具身智能体的学习与进化范式。该方法设计具身上下文增强的多模态大语言模型,用以模拟大脑左半球的语言处理与逻辑分析能力,负责理解指令与视觉场景;同时,基于循环状态空间模型构建感知上下文引导的世界模型,以模拟右半球的空间感知与整体思维功能,从而捕获环境动态并预测未来状态。进一步地,通过模拟胼胝体的信息沟通机制,提出动态通信槽,实现 MLLM 与世界模型之间的高效信息交互。实验结果表明,该范式能够显著提升具身智能体在一系列任务中的性能,并通过具身探索与在线进化机制,提高其在零样本任务中的泛化能力。相关成果获得 ACM MM 2025 最佳学生论文奖。

个人简介: 高君宇,中国科学院自动化研究所副研究员。主要研究方向为视频理解、具身智能、多媒体计算,在人工智能领域旗舰会议和期刊发表论文 60 余篇,其中一作论文 20 余篇,谷歌引用 4000 余次。曾获中国科学院院长特别奖、中国科学院优秀博士论文、百度奖学金等荣誉,入选中国科协青年人才托举工程。作为项目和课题负责人,主持基金委面上项目、青年基金、科技创新 2030“新一代人工智能”重大项目子课题、基金重点课题、CCF-海康威视斑头雁基金等多个项目。相关成果获 2025 年度吴文俊人工智能科学技术奖技术发明奖一等奖、2024 年度江苏省科学技术奖二等奖、ACM MM 2025 最佳学生论文奖。

报告题目:探索视觉感知新范式:基于摩尔纹的超高精度微状态感知

宁静仪

南京大学,助理研究员/毓秀青年学者

摘要: 传统计算机视觉的感知精度通常止步于像素级,难以对三维微观世界实现“超分辨”感知,因此追求超高精度的空间感知仍然是研究者们不断探索的目标。本报告将重点介绍基于“摩尔纹”视觉的超高精度微状态感知机制研究及相关拓展。回顾摩尔纹视觉的“前世”,由感光元件高频干扰产生的不规则摩尔纹一直被视为成像质量的阻碍,使得研究者们长期致力于通过多种手段对其进行消除。而报告人另辟蹊径,从传统“消除”思路转向“增强”,创新性地探索基于摩尔纹视觉的超高精度感知理论与技术体系,为突破现有视觉分辨率瓶颈提供理论与技术支撑,开启摩尔纹视觉感知“今生”的新阶段。此外,报告人还将分享相关研究进展在智能制造、智慧医疗等前沿领域的应用成果。

个人简介: 宁静仪,南京大学计算机学院助理研究员/毓秀青年学者。主要研究领域为智能感知与移动计算。近年来,在 ACM MobiCom、ACM UbiComp、IEEE INFOCOM、IEEE JSAC、IEEE TMC 等国际会议/期刊上发表 CCF A 类论文 20 篇。曾获 2025 年度 ACM 中国优博奖、江苏省计算机学会优博、物联网领域十大科技进展提名奖等。主持国家自然科学基金青年基金项目、江苏省自然科学基金青年基金项目、中国博士后科学基金面上项目等,作为核心骨干参与国家自然科学基金重大研究计划重点项目、国家自然科学基金专项项目、江苏省基础研究计划重点项目等。

报告题目:智能图像视频编码

李礼

中国科学技术大学,教授

摘要: 深度学习技术的快速发展为图像视频编码领域带来了新的突破机遇,本报告将介绍团队在智能图像视频编码方面的探索。具体而言,报告将围绕以下三个维度展开:1)介绍团队在智能图像编码及标准化方面的工作,并进一步阐述基于变换大模型的端到端图像压缩框架;2)概述团队在智能视频编码方向的进展,并介绍团队基于熵模型大模型的端到端视频压缩框架;3)展望大模型与编码技术融合的未来发展方向,以期为推动大模型及新一代智能编码技术的进步提供有益启示。

个人简介: 李礼,中国科学技术大学信息学院副院长、特任教授、博士生导师,国家级青年人才。主要研究方向为多媒体通信。发表国际期刊和会议论文100余篇,谷歌学术引用6000余次。获授权专利30余项,被标准化组织采纳技术提案30余项。担任顶级期刊IEEE Transactions on Circuits and Systems for Video Technology 资深编委和 IEEE Transactions on Multimedia编委。主持科技部重点研发计划课题、基金委面上项目等。曾获2019年国家技术发明二等奖,2024达摩院青橙奖,2023多媒体新星奖。

报告题目:环境即智能:物理 AI 研究的范式转移与关键挑战

封硕

清华大学,副教授

摘要:传统人工智能研究多以智能体算法为核心,环境常被简化为封闭黑箱。然而,在机器人、自动驾驶等物理AI场景中,环境的物理复杂性、动态交互与多模态感知成为根本瓶颈。本报告提出“环境即智能”的范式转移:物理AI的智能不仅来自智能体大脑,更源于高保真的环境生成——世界模型。精细的环境模型可充当无限安全测试场,加速策略训练,并作为外部大脑引导智能体认知发育,实现“好的环境塑造智能”。报告将系统阐述这一转变,并探讨关键挑战。该视角有望重塑物理AI的研究路径与工程实践。

个人简介: 封硕,清华大学自动化系副教授、博士生导师,目前担任系统工程研究所副所长,入选国家高层次青年人才计划。从事具身智能系统/世界模型领域研究,以通讯作者或第一作者在《自然》(2023,封面论文)、《自然·通讯》(2021、2024、2026)等高水平期刊发表论文。曾获 IEEE 智能交通系统学会最佳博士学位论文奖、美国运筹与管理协会智能交通系统年度最佳论文奖、《麻省理工科技评论》中国区“35 岁以下科技创新 35 人”、达摩院青橙奖、AI100 青年先锋、中国自动化学会青年科技奖等荣誉。