首页 抖音热门文章正文

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

抖音热门 2025年10月21日 12:59 0 aa
Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

本期为TechBeat人工智能社区720线上Talk。

北京时间10月22日(周三) 20:00,加州大学圣克鲁兹分校博士生刘彦青的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: OpenVision - 构建通用视觉模型的新范式,届时他将围绕OpenVision系列的五项代表性工作,系统展示团队在训练范式、数据构建与模型设计上的阶段性探索。

Talk·信息

主题:OpenVision - 构建通用视觉模型的新范式

嘉宾:加州大学圣克鲁兹分校 · 博士生 - 刘彦青

时间:北京时间 10月22日(周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

Talk·介绍

在多模态基础模型迅速发展的今天,OpenVision 系列试图回应一个核心问题:是否存在一种开放、可复现、具备学术可持续性的视觉语言预训练路径?本次分享将围绕五项代表性工作,系统展示我们在训练范式、数据构建与模型设计上的阶段性探索。

Talk大纲

1. 研究动机与开放挑战

- 多模态基础模型当前发展路径的封闭性困境

- 训练成本、数据质量、可复现性三大门槛

2. OpenVision 路线概览

- 五阶段代表性工作简介

- 构建一个系统化、全链条开放的研究框架

3. 阶段成果 I:训练与数据的基础设施建设

- CLIPA:大规模 CLIP 训练中的 inverse scaling law

- ReCap:基于 LLaMA-3 的十亿级图文重写数据集

4. 阶段成果 II:模型结构与训练范式的创新

- CLIPS:合成字幕下的并行优化策略(对比 + 生成)

- OpenVision:面向多模态学习的开放视觉编码器家族

- OpenVision 2:生成式预训练视觉模型的新路径

5. 总结与展望:视觉预训练模型的开放实践与未来演进

- 开放实践中的关键技术经验与挑战

- 多模态预训练的下一步研究方向与可能路径

Talk·预习资料

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2305.07017

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2406.08478

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2411.16828

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2505.04601

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2509.01644

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2103.00020

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

论文链接:

https://arxiv.org/abs/2303.15343

Talk·提问交流

在Talk界面下的 【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

Talk·嘉宾介绍

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

刘彦青

加州大学圣克鲁兹分校 · 博士生

刘彦青,加州大学圣克鲁兹分校计算机科学博士生,师从谢慈航教授,目前在 Google 担任 Student Researcher。2023 年本科毕业于浙江大学,曾在新加坡国立大学、上海人工智能实验室等机构从事研究工作。研究方向包括多模态学习、视觉语言预训练与基础模型,聚焦构建具备开放性、可扩展性与可复现性的视觉表征体系,致力于发展能与语言自然交互、支持多模态推理的通用视觉模型。

个人主页:

https://www.techbeat.net/grzytrkj?id=45776

-The End-

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

如果你也想成为讲者

自荐 / 推荐

Talk预告 | 加州大学圣克鲁兹分校刘彦青:OpenVision - 构建通用视觉模型的新范式

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap