

(通讯员:谢东霖 李姗姗)6月5日下午,应cbin仲博网页版邀请,麒麟信安研究院AI顾问(副院长)汪钟鸣教授,进行了主题为“揭密大语言模型的认知逻辑”的学术报告,本次报告由cbin仲博网页版童钊教授主持,科研办组织召开,2023、2024级研究生及相关老师参加。
本次分享旨在综述大语言模型的最新进展,内容涵盖主流模型家族、核心构建技术、使用与评估方法,以及未来待深入的研究方向。汪钟鸣教授首先指出,LLMs的成功基于三大支柱:一是百亿级参数的Transformer架构通过层层堆叠不断演化,为模型提供了深度、多层次的表征能力;二是海量文本的自监督预测训练激发了“语言涌现”能力,使模型能够在大规模语料中捕捉复杂的语义关联;三是以GPT、LLaMA、PaLM等家族为代表的算力革命不断加速,从最初的基础版本演进到GPT-4 Vision等多模态系统,推动了ChatGPT的迅速爆发。同时,Meta的LLaMA和Google的PaLM系列通过开源生态促进了技术普及与共享。针对LLMs的数学本质,汪教授强调:“自注意力机制实为对人类语义网络的数学模拟”,即模型内部各向量之间的交互正是在模拟人脑中多元语义节点的关联与传播。讲座尾声,汪教授与师生就热点问题展开深入探讨。在“大语言模型与安全”议题中,他提出“技术可控性应纳入模型开发全流程”的建议,强调需通过算法审计与数据治理平衡创新与安全。

此次讲座为师生带来深刻启发。汪教授的前沿洞见不仅揭示了语言智能的内在规律,更从计算语言学、认知科学与人工智能交叉领域切入,拓宽了跨学科研究的创新视野。
主讲人简介:
汪钟鸣,原国防科技大学计算机学院教授、国防科技大学网络管理中心负责人;总参军训部全军军事训练信息中心总负责人;原国家信息中心电子政务处处长(国家电子政务外网建设办公室常务副主任)及专家委员会副秘书长;原神州数码有限公司军工事业部总经理;原达闼机器人公司系统架构师;现麒麟信安研究院AI顾问(副院长)。
编辑:谢东霖 李姗姗
一审:崔玉茹
二审:童钊
三审:周劲松