Talk预告 | 加州大学圣克鲁兹分校刘彦青：OpenVision - 构建通用视觉模型的新范式

抖音热门 2025年10月21日 12:59 0 aa

本期为TechBeat人工智能社区第720期线上Talk。

北京时间10月22日(周三) 20:00，加州大学圣克鲁兹分校博士生刘彦青的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: OpenVision - 构建通用视觉模型的新范式，届时他将围绕OpenVision系列的五项代表性工作，系统展示团队在训练范式、数据构建与模型设计上的阶段性探索。

Talk·信息

▼

主题：OpenVision - 构建通用视觉模型的新范式

嘉宾：加州大学圣克鲁兹分校 · 博士生 - 刘彦青

时间：北京时间 10月22日(周三) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍▼

在多模态基础模型迅速发展的今天，OpenVision 系列试图回应一个核心问题：是否存在一种开放、可复现、具备学术可持续性的视觉语言预训练路径？本次分享将围绕五项代表性工作，系统展示我们在训练范式、数据构建与模型设计上的阶段性探索。

Talk大纲

1. 研究动机与开放挑战

- 多模态基础模型当前发展路径的封闭性困境

- 训练成本、数据质量、可复现性三大门槛

2. OpenVision 路线概览

- 五阶段代表性工作简介

- 构建一个系统化、全链条开放的研究框架

3. 阶段成果 I：训练与数据的基础设施建设

- CLIPA：大规模 CLIP 训练中的 inverse scaling law

- ReCap：基于 LLaMA-3 的十亿级图文重写数据集

4. 阶段成果 II：模型结构与训练范式的创新

- CLIPS：合成字幕下的并行优化策略（对比 + 生成）

- OpenVision：面向多模态学习的开放视觉编码器家族

- OpenVision 2：生成式预训练视觉模型的新路径

5. 总结与展望：视觉预训练模型的开放实践与未来演进

- 开放实践中的关键技术经验与挑战

- 多模态预训练的下一步研究方向与可能路径

Talk·预习资料

▼

论文链接：

https://arxiv.org/abs/2305.07017

论文链接：

https://arxiv.org/abs/2406.08478

论文链接：

https://arxiv.org/abs/2411.16828

论文链接：

https://arxiv.org/abs/2505.04601

论文链接：

https://arxiv.org/abs/2509.01644

论文链接：

https://arxiv.org/abs/2103.00020

论文链接：

https://arxiv.org/abs/2303.15343

Talk·提问交流

▼

在Talk界面下的 【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

刘彦青

加州大学圣克鲁兹分校 · 博士生

刘彦青，加州大学圣克鲁兹分校计算机科学博士生，师从谢慈航教授，目前在 Google 担任 Student Researcher。2023 年本科毕业于浙江大学，曾在新加坡国立大学、上海人工智能实验室等机构从事研究工作。研究方向包括多模态学习、视觉语言预训练与基础模型，聚焦构建具备开放性、可扩展性与可复现性的视觉表征体系，致力于发展能与语言自然交互、支持多模态推理的通用视觉模型。

个人主页:

https://www.techbeat.net/grzytrkj?id=45776

-The End-