• 校内登录
访问量:   最后更新时间:--

贺宇航

电子邮箱:
所在单位:人工智能学院
学历:硕博连读
办公地点:
性别:男
联系方式:
学位:博士
职称:助理教授
博士生导师:否
硕士生导师:否
我的新闻
当前位置: 中文主页 > 我的新闻
课题组斩获百度商业AI技术创新大赛亚军(2/3151)
发布时间:2024-08-30    点击次数:

发布时间:2024-08-30

文章标题:课题组斩获百度商业AI技术创新大赛亚军(2/3151)

内容:

    在由百度和Nvidia联合举办的第二届百度商业AI技术创新大赛中,由焦天才、宋文涛、马帮和赵云龙四位同学组成的团队在激烈的竞争中脱颖而出,荣获全国总排名第二的优异成绩,在高校团队里排名第一。本次大赛吸引了来自全国263所高校的3395名参赛者,共组建了3151支队伍。经过长达三个月的激烈比拼,团队凭借卓越的AI技术实力和创新应用,在众多参赛队伍中一路过关斩将,最终进入决赛并取得令人瞩目的成绩。在决赛阶段,课题组团队展示了他们在商业AI应用场景下的创新解决方案,凸显了团队在解决实际问题方面的创造力和合作精神。课题组团队的出色表现为学校赢得了荣誉,也为高校AI研究注入了新的活力。此次成绩的取得不仅展现了他们的技术实力,也为高校学子在未来的AI技术发展道路上树立了榜样。

赛题设置:在百度商业营销场景,广告图片生成精细化描述具有重要意义和价值。当前,随着大模型时代的到来,利用多模态大语言模型(MLLM)生成图片描述已经成为业界的通用做法(DallE3,Sora, Stable Diffusion3)。本赛道任务是广告图片描述生成,期望通过高质量数据和建模优化,提升图片描述的准确性和完备性。

本次任务提供百度商业真实的广告图片和图片中文描述,数据量级约100万,参赛者自行划分训练集和验证集。 每条样本数据包括了三列,采用tab分割,分别为: * 图片id * 图片base64编码 * 图片的文字描述。如下图所示,通常包括了对图片中各个主体(人物的外貌、衣着、表情、物体颜色)、主体之间关系、背景、风格等细粒度描述。

针对以上任务,研究团队通过构建高效的数据管道、优化SFT训练、精细化Prompt Tuning以及加速性能推理,使得模型在精度和性能上均取得了显著提升,最终在大赛中荣获亚军。

表格

中度可信度描述已自动生成

许多人在沙滩上

描述已自动生成

本次比赛团队由焦天才、宋文涛、马帮、赵云龙组队完成,由西安交通大学人工智能学院贺宇航助理教授、龚怡宏教授共同指导完成。

总决赛获奖名单:总决赛获奖名单.jpg (1080×2109) (baidu.com)