Chao Yang

杨超, 青年科学家, 上海人工智能实验室

yangchao.png

个人简介

现就职于上海人工智能实验室,担任青年科学家,主要负责大模型与智能体算法相关研究。于2022年6月博士毕业于清华大学计算机科学与技术系,师从孙富春教授刘华平教授。此前,我还在乔宇教授的指导下完成了博士后研究,专注于大语言模型的安全相关研究。

研究方向

我的研究兴趣主要集中在以下几个方面:

  • 大语言模型安全:大模型后训练与安全对齐、大模型攻击与防御
  • 多模态大模型:模态融合、多模态对齐、视觉问答
  • 机器人具身智能:机器人操作、强化学习、模仿学习

主要成就

学术贡献

  • 已获得上海市超级博士后上海市青年科技英才扬帆计划等项目资助
  • 研究成果被NeurIPSCVPRICLRACLAAAI等多个人工智能顶级会议接收
  • 截至2025年8月,谷歌学术总引用量达5700余次

重要工作亮点

🏆 ACL 2024 Outstanding Paper Award

  • 大模型安全相关工作”Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!”
  • 首次揭示了目前大模型后训练阶段的安全漏洞,为大模型安全加固方法提供了重要的安全风险预警。

🎤 NeurIPS 2019 Spotlight Oral

  • 理论完备的观测模仿理论方法”Imitation learning from observations by minimizing inverse dynamics disagreement”
  • 为机器人高效技能学习提供了理论保障。

使命愿景

致力于构建可信赖的通用人工智能,推动AI技术的安全发展与应用