Chao Yang
杨超, 青年科学家, 上海人工智能实验室

个人简介
现就职于上海人工智能实验室,担任青年科学家,主要负责大模型与智能体算法相关研究。于2022年6月博士毕业于清华大学计算机科学与技术系,师从孙富春教授和刘华平教授。此前,我还在乔宇教授的指导下完成了博士后研究,专注于大语言模型的安全相关研究。
研究方向
我的研究兴趣主要集中在以下几个方面:
- 大语言模型安全:大模型后训练与安全对齐、大模型攻击与防御
- 多模态大模型:模态融合、多模态对齐、视觉问答
- 机器人具身智能:机器人操作、强化学习、模仿学习
主要成就
学术贡献
- 已获得上海市超级博士后、上海市青年科技英才扬帆计划等项目资助
- 研究成果被NeurIPS、CVPR、ICLR、ACL、AAAI等多个人工智能顶级会议接收
- 截至2025年8月,谷歌学术总引用量达5700余次
重要工作亮点
🏆 ACL 2024 Outstanding Paper Award
- 大模型安全相关工作”Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!”
- 首次揭示了目前大模型后训练阶段的安全漏洞,为大模型安全加固方法提供了重要的安全风险预警。
🎤 NeurIPS 2019 Spotlight Oral
- 理论完备的观测模仿理论方法”Imitation learning from observations by minimizing inverse dynamics disagreement”
- 为机器人高效技能学习提供了理论保障。
使命愿景
致力于构建可信赖的通用人工智能,推动AI技术的安全发展与应用