5月19日,受计智学院邀请,伦敦大学学院(UCL)统计科学系薛景浩教授在敦雅楼C501教室为学院教师和2024级研究生120多人做学术报告。

薛景浩教授以“Probing CLIP’s Comprehension of 360-Degree Textual and Visual Semantics”为题,从CLIP 模型全景语义理解的研究背景与挑战出发,系统介绍了CLIP 模型在室内导航、智能驾驶、增强现实等全景场景中的应用价值。在CLIP全景语义理解能力的实验探究与核心问题方面,重点展示了利用统计假设检验方法评估不同实验条件下视觉文本语义相关性的研究过程。最后,基于LoRA技术的 CLIP模型优化与效果验证,详细介绍了通过LoRA低秩适配技术微调CLIP模型的优化方案。
薛景浩教授凭借其深厚的学术背景与丰富的国际科研经验,为与会者带来了多模态人工智能前沿技术的深度分享与国际化研究视角的深刻见解,他的精彩分享赢得了现场师生的广泛好评。
本次报告会不仅为学院师生搭建了与高水平学者交流的平台,助力师生及时把握学科前沿动态,也进一步推动我院在多模态人工智能与视觉语言模型研究领域与海外高水平研究机构之间的学术交流与合作。下一步,学院将常态化邀请海内外知名专家学者来校开展学术交流,持续提升学科建设水平与人才培养质量,全力助推学院人才培养与科研工作高质量发展。(图/文:李建龙;初审:来明展;终审:李琪飞)
(薛景浩教授简介:薛景浩教授1998 年于清华大学获得信号与信息处理工学博士学位,2008 年于格拉斯哥大学获得统计学博士学位,现任伦敦大学学院(UCL)统计科学系统计模式识别方向教授,担任 IEEE Transactions on Circuits and Systems for Video Technology 期刊高级区域编辑。研究领域涵盖统计模式识别、机器学习与计算机视觉等方向,在相关领域积累了丰富的科研成果和显著的国际影响力。)