清华大学黄民烈团队：发布安全评估框架促大模型迈向可控可信

2023-03-31 中国新闻网76

核心提示：中新网北京3月27日电 (贾君玉张素)记者近日采访清华大学计算机科学与技术系长聘副教授黄民烈获悉，历时两年

中新网北京3月27日电 (贾君玉张素)记者近日采访清华大学计算机科学与技术系长聘副教授黄民烈获悉，历时两年多时间，由他带领的科研团队建立了大模型安全分类体系，并从系统层面和模型层面等打造了大模型安全框架。

近年来，随着技术突破，大模型获得快速发展并在多个场景得到应用。不过，其存在的事实性错误、知识盲区等问题，以及面临的训练数据来源合规性、生成内容安全性等风险，也已受到广泛关注。

在黄民烈看来，要规避安全风险，降低人工智能对人类的负面影响，关键在于大模型底座。“大规模语言模型(LLM)发展到现在，模型结构和规模已有很大进展，但实用性还有待加强，我们应该通过技术让模型更加安全、可控，使其快速适配更多的应用场景。”他说。

此次，聆心智能联合清华大学CoAI实验室共同发布大模型安全评估框架。作为聆心智能的创始人，黄民烈介绍说，他们希望通过对大模型应用边界进行定义，促进大模型生态健康发展，推动人工智能研究和应用向更有用、更可信、更安全迈进。

据知，黄民烈团队建立的大模型安全分类体系中设定的不安全对话场景，包括犯罪违法、身体健康、心理健康、财产隐私、歧视/偏见、辱骂/仇恨言论等方面。科研人员针对这些安全场景对大模型进行升级，使之具备基本的安全性，“能够在遇到安全问题时给予正确的回复策略，不进行判断误导”。

此外，着眼于容易触发的安全问题类型，科研团队还总结、设计出一般模型难以处理的“安全攻击方式”，使安全体系更加完善。

黄民烈表示，未来，他们将打造中文大模型的安全风险评估的Leaderboard，为国内对话大模型的安全评估提供公平公开的测试平台，并提供针对中文对话的安全场景等，“依托自身核心技术，在可控可信的超拟人大模型基础之上，通过建立安全、可控的模型边界，让人工智能提供可信、可靠的输出”。(完)

免责声明：本网转载自其它媒体的文章，目的在于弘扬科技创新精神，传递更多科技创新信息，并不代表本网赞同其观点和对其真实性负责，在此我们谨向原作者和原媒体致以敬意。如果您认为本站文章侵犯了您的版权，请与我们联系，我们将第一时间删除。

更多>同类资讯

推荐图文

已正式开启报名！英特	AI PC释放开发创意，
从AI PC到智慧医疗，	为创新成长提速—「阿

推荐资讯

点击排行

粤公网安备 44040202001358号

• 已正式开启报名！英特尔人工智能创新应用大赛为	• AI PC释放开发创意，英特尔人工智能创新应用大
• 从AI PC到智慧医疗，锐炫GPU为AI应用带来强劲算	• 为创新成长提速—「阿里云创业者计划」云栖大会
• 携手ChainGPT 人工智能基础设施波场TRON革新 W	• “AI换脸”侵害肖像权吗？
• 自动驾驶商业化加速落地	• 引入创新火种，33家创业公司入选第二届宁波海曙
• 2023首届AI医学大会召开最强大脑助力AI医学	• 联想创新科技大会：释放人工智能力量
• 科技赋能传统文化传承民族文化元宇宙体验馆在	• 度小满CEO朱光：大模型发展进入应用落地的“第
• 智能应用创新为未来做好准备	• 产学研合力破解机器人产业“缺工”困局
• 解决生成式人工智能知识产权难题的三个途径	• 锻造国产大模型核心竞争力

清华大学黄民烈团队：发布安全评估框架 促大模型迈向可控可信