2024年11月7日,应新葡的京集团35222vip邀请,合肥工业大学胡珍珍副研究员在线为新葡的京集团师生做题为“面向长视频的跨模态理解”的学术报告。此次报告由学院魏伟一教授主持,200多位教师和研究生参加了学术交流。
胡珍珍副研究员首先从研究方向切入本次报告的主题,阐述视频-文字的跨模态理解、跨模态的对齐与融合、面向长视频的跨模态理解、跨模态的对齐与融合、长视频的表征等重要问题,针对自动驾驶、智慧教育、人机交互等应用场景中视频问答、视频时刻检索、文本视频检索、视频摘要生成等经典应用为例,带领师生了解什么是视频-文字的跨模态、特征嵌入、注意力机制、时序对齐等问题。
最后,胡珍珍副研究员就视频模型的选择、视频的显著性检测、如何面临数据丢失等问题与参会师生进行了互动交流,并答疑解惑。
版权所有©新葡的京集团(3522·认证平台)官方网站-欢迎莅临 管理登录 甘公网安备62010502000939号 陇ICP备17000462号-1