FineVision发布：开源视觉-语言模型训练数据集•覆盖17.3M张图片，

爱生活爱珂珂 2025-09-05 08:42:07

FineVision发布：开源视觉-语言模型训练数据集

• 覆盖17.3M张图片，24.3M样本，88.9M对话轮次，9.5B回答tokens，规模远超主流开源数据集

• 训练模型表现显著优于Cauldron、Cambrian、LLaVa等竞品，数据多样性与质量兼备

• 数据集污染率仅1%，相比其他数据集2-3%污染更低，保证了更真实的benchmark评测效果

• 每轮对话均由Qwen3-32B模型打分，评估格式、相关性、视觉依赖性与图像对应性，剔除高质量样本反而影响性能，显示稀疏样本的潜在价值

• 传统两阶段训练策略在FineVision上几乎无优势，一阶段训练即可达到同等甚至更优效果，简化流程提升效率

• 社区协作推动，期待FineVision激发更多创新应用，助力视觉-语言模型向更高水平发展

详细实验与数据集下载👉 huggingface.co/spaces/HuggingFaceM4/FineVision

官方博客解读🔗 huggingface.co/blog/finevision

视觉语言模型开源数据集人工智能多模态学习机器学习

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

“AI什么都会，我为什么还要学物理化学语文？”（解读见长图）人工智能ai兴趣创

2

解决问题的心智模式（解读见长图）

3

理解下层抽象的重要性（解读见长图）人工智能 ai兴趣创作计划

4

【[670星]”数学不难“ 之《线性代数不难》：用Python和可视化轻松搞定

5

晚安～ [月亮] 晚安

6

《爱可可微博热门分享(6.11)》

7

【[55星]WBC_Deploy：基于XR的机器人遥操作与数据采集系统。亮点：1

8

【[103星]patolette：一个C / Python颜色量化和抖动库，为高

9

【[493星]gemini-mcp-server：为开发者提供强大的AI协作开发

10

【[717星]mcp-shrimp-task-manager：为AI Agent

热门分类

科技TOP

1

光刻机禁售，我忍了。芯片技术封锁，我也忍了。但全国首台国产电子束光刻机在杭州

2

太tm解气了，当华为pura80ultra更新后，麒麟9020出现的那一刻，心

3

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

4

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

5

华为的前三号员工1.任正非（工号001）华为创始人，1987年集资2.1万

6

追觅官宣造车追觅：要造最快的车！这么卷的汽车市场还有选手入场，给追觅点赞[爱你

7

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

8

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

9

实锤了！中国不买美国芯片，H20就暂停生产了，现在黄仁勋更加睡不着觉了，由于这次

10

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

科技最新文章

1

这下总算是放心了，荣耀也算是看明白了，Magic8Pro的居中模组设计不会变，

2

无敌+够用+便宜！这应该是对于荣耀X70最全面的评价了！无敌：说的是8300

3

iPhone17系列内存配置曝光是不是都会选12GB内存的？

4

不可思议！就在刚刚华为正式官宣了！9月4日，华为在深圳宣布：推出首款智慧屏M

5

我终于明白华为为何敢公布芯片了！不是因为性能超越了同行，也不是为了营

6

华为新品发布会第一款matePadmini凉透华为透支着花粉的热情这么大

7

真我15T，MT6835，6.57英寸直屏，2372*1080p，60(80)W

8

实锤了，国行版iPhone17Pro将会使用京东方的屏幕，这样国行版就是三家供

9

刘强东为什么走到哪里都亲自拿着手机，不是因为手机里有商业机密，更不是因为不相信自

10

华为MateXTS正式发布了，主要提升就是芯片升级成麒麟9020，然后新增了一