Chao Yang

杨超, 青年科学家, 上海人工智能实验室

个人简介

现就职于上海人工智能实验室，担任青年科学家，主要负责大模型与智能体算法相关研究。于2022年6月博士毕业于清华大学计算机科学与技术系，师从孙富春教授和刘华平教授。此前，我还在乔宇教授的指导下完成了博士后研究，专注于大语言模型的安全相关研究。

研究方向

我的研究兴趣主要集中在以下几个方面：

大语言模型安全：大模型后训练与安全对齐、大模型攻击与防御
多模态大模型：模态融合、多模态对齐、视觉问答
机器人具身智能：机器人操作、强化学习、模仿学习

主要成就

学术贡献

已获得上海市超级博士后、上海市青年科技英才扬帆计划等项目资助
研究成果被NeurIPS、CVPR、ICLR、ACL、AAAI等多个人工智能顶级会议接收
截至2025年8月，谷歌学术总引用量达5700余次

重要工作亮点

🏆 ACL 2024 Outstanding Paper Award

大模型安全相关工作”Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!”
首次揭示了目前大模型后训练阶段的安全漏洞，为大模型安全加固方法提供了重要的安全风险预警。

🎤 NeurIPS 2019 Spotlight Oral

理论完备的观测模仿理论方法”Imitation learning from observations by minimizing inverse dynamics disagreement”
为机器人高效技能学习提供了理论保障。

使命愿景

致力于构建可信赖的通用人工智能，推动AI技术的安全发展与应用