Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety

Xingjun Ma; Yifeng Gao; Yixu Wang; Ruofan Wang; Xin Wang; Ye Sun; Yifan Ding; Hengyuan Xu; Yunhao Chen; Yunhao Zhao; Hanxun Huang; Yige Li; Yutao Wu; Jiaming Zhang; Xiang Zheng; Yang Bai; Yiming Li; Zuxuan Wu; Xipeng Qiu; Jingfeng Zhang; Xudong Han; Haonan Li; Jun Sun; Cong Wang; Jindong Gu; Baoyuan Wu; Siheng Chen; Tianwei Zhang; Yang Liu; Mingming Gong; Tongliang Liu; Shirui Pan; Cihang Xie; Tianyu Pang; Yinpeng Dong; Ruoxi Jia; Yang Zhang; Shiqing Ma; Xiangyu Zhang; Neil Gong; Chaowei Xiao; Sarah Erfani; Tim Baldwin; Bo Li; Masashi Sugiyama; Dacheng Tao; James Bailey; Yu-Gang Jiang

doi:10.1561/3300000051

Foundations and Trends® in Privacy and Security > Vol 8 > Issue 3-4

Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety

By Xingjun Ma, Fudan University, China, xingjunma@fudan.edu.cn | Yifeng Gao, Fudan University, China | Yixu Wang, Fudan University, China | Ruofan Wang, Fudan University, China | Xin Wang, Fudan University, China | Ye Sun, Fudan University, China | Yifan Ding, Fudan University, China | Hengyuan Xu, Fudan University, China | Yunhao Chen, Fudan University, China | Yunhao Zhao, Fudan University, China | Hanxun Huang, The University of Melbourne, Australia | Yige Li, Singapore Management University, Singapore | Yutao Wu, Deakin University, Australia | Jiaming Zhang, Hong Kong University of Science and Technology, Hong Kong | Xiang Zheng, City University of Hong Kong, Hong Kong | Yang Bai, ByteDance, China | Yiming Li, Nanyang Technological University, Singapore | Zuxuan Wu, Fudan University, China | Xipeng Qiu, Fudan University, China | Jingfeng Zhang, University of Auckland, New Zealand and RIKEN, Japan | Xudong Han, MBZUAI, UAE | Haonan Li, MBZUAI, UAE | Jun Sun, Singapore Management University, Singapore | Cong Wang, City University of Hong Kong, Hong Kong | Jindong Gu, University of Oxford, UK | Baoyuan Wu, Chinese University of Hong Kong, Shenzhen, China | Siheng Chen, Shanghai Jiao Tong University, China | Tianwei Zhang, Nanyang Technological University, Singapore | Yang Liu, Nanyang Technological University, Singapore | Mingming Gong, The University of Melbourne, Australia | Tongliang Liu, The University of Sydney, Australia | Shirui Pan, Griffith University, Australia | Cihang Xie, University of California, Santa Cruz, USA | Tianyu Pang, Sea AI Lab, Singapore | Yinpeng Dong, Tsinghua University, China | Ruoxi Jia, Virginia Tech, USA | Yang Zhang, CISPA Helmholtz Center for Information Security, Germany | Shiqing Ma, University of Massachusetts Amherst, USA | Xiangyu Zhang, Purdue University, USA | Neil Gong, Duke University, USA | Chaowei Xiao, University of Wisconsin - Madison, USA | Sarah Erfani, The University of Melbourne, Australia | Tim Baldwin, The University of Melbourne, Australia and MBZUAI, UAE | Bo Li, University of Illinois Urbana-Champaign, USA | Masashi Sugiyama, RIKEN, Japan and The University of Tokyo, Japan | Dacheng Tao, Nanyang Technological University, Singapore | James Bailey, The University of Melbourne, Australia | Yu-Gang Jiang, Fudan University, China, ygj@fudan.edu.cn

Suggested Citation

Xingjun Ma, Yifeng Gao, Yixu Wang, Ruofan Wang, Xin Wang, Ye Sun, Yifan Ding, Hengyuan Xu, Yunhao Chen, Yunhao Zhao, Hanxun Huang, Yige Li, Yutao Wu, Jiaming Zhang, Xiang Zheng, Yang Bai, Yiming Li, Zuxuan Wu, Xipeng Qiu, Jingfeng Zhang, Xudong Han, Haonan Li, Jun Sun, Cong Wang, Jindong Gu, Baoyuan Wu, Siheng Chen, Tianwei Zhang, Yang Liu, Mingming Gong, Tongliang Liu, Shirui Pan, Cihang Xie, Tianyu Pang, Yinpeng Dong, Ruoxi Jia, Yang Zhang, Shiqing Ma, Xiangyu Zhang, Neil Gong, Chaowei Xiao, Sarah Erfani, Tim Baldwin, Bo Li, Masashi Sugiyama, Dacheng Tao, James Bailey and Yu-Gang Jiang (2025), "Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety", Foundations and Trends® in Privacy and Security: Vol. 8: No. 3-4, pp 254-469. http://dx.doi.org/10.1561/3300000051

Publication Date: 15 Sep 2025

Subjects

Security, Privacy, Trust and provenance, Robustness, Deep learning

Keywords

Large model safety, Agent safety, AI safety

1. Introduction
2. Vision Foundation Model Safety
3. Large Language Model Safety
4. Vision-language Pre-training Model Safety
5. Vision-language Model Safety
6. Diffusion Model Safety
7. Agent Safety
8. Open Challenges
9. Conclusion
Author Contributions
References

Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety

Free Preview:

Share

Journal details

Abstract

Book details

Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety