百度开源视觉理解模型全尺寸视觉大模型登场百度智能云千帆正式推出全新视觉理解模型—

量子位看科技 2025-09-23 11:28:28

百度开源视觉理解模型全尺寸视觉大模型登场

百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL，并全面开源！

该系列包含3B、8B和70B三个尺寸版本，是面向企业级多模态应用场景，进行了深度优化的视觉理解大模型。Qianfan-VL不仅具备出色的基础通用能力，还针对产业落地中的高频需求，如OCR和教育垂直场景做了专项强化，使其在实际应用中表现更加卓越。

Qianfan-VL系列模型是由百度智能云千帆模型研发团队，基于开源模型进行开发，并在百度自研昆仑芯P800上完成全流程计算任务。昆仑芯P800提供了强大的算力支撑，确保模型能够高效处理海量数据与复杂算法，同时支持单任务5000卡规模的并行计算。这一结合不仅优化了模型计算的效率，更使得模型在性能表现上达到了新的高度，在通用和垂类任务评测中展现出SOTA水平。

Qianfan-VL模型具备三大特点：

- 多尺寸模型满足不同场景需求：提供3B、8B、70B三种规格的模型，让不同规模的企业和开发者都能找到合适的解决方案。

- 提供思考推理能力：8B和70B模型支持通过特殊token激活思维链能力，覆盖复杂图表理解、视觉推理、数学解题等多种场景。

- OCR与文档理解能力增强：主打OCR全场景识别和复杂版面文档理解两大特色能力，在多项基准测试中表现优异，为企业级应用提供高精度的视觉理解解决方案。

下面详细来看：

0 阅读：4

量子位看科技

感谢大家的关注

作者最新文章

1

GitHub各类算法合集学习Python算法宝藏仓库GitHub有个算法搜集项目

2

小扎挖走马斯克机器人一号位特斯拉机器人一号位跳槽Meta小扎又从马斯克“大本营”

3

让AI没有机械味提示词6个提示词好用到作弊有人整理了堪称“作弊”的万能提示词，个

4

AI攻破流体百年难题DeepMind找到隐形奇点流体动力学奇点问题，已困扰科学界

5

用AI轻松带娃学习AI趣味学习法通过AI工具，可以给老师和家长减负，不再为备课、

6

物理界也有GPT了科学家训练出通用物理模型科学家正在尝试打造一个“通用物理模型”

7

老乡鸡菜谱开源了我在GitHub学做老乡鸡老乡鸡菜谱在GitHub开源了！有人把

8

硅谷天价挖人挖疯了AI人才大缺血咋办AI发展日新月异，背后的竞争不仅是技术角逐，

9

阿里通义DeepResearch登顶Agent榜通义DeepResearch训练

10

AI恋爱原来是日久生情模型更新成AI伴侣最大噩梦你和AI聊过天，有没有发现自己对

热门分类

科技TOP

1

小米澎湃OS微信聊天能发实况图澎湃OS现在正式支持在微信聊天框发Live图了。

2

华为Mate80真香！一下子拿下两台！Mate30正式退居二线

3

细思极恐，华为这招是真的高原来4699起的Mate80系，只是个开胃菜，大家

4

iPhone12，4GB运存iPhone13，4GB运存iPhone14，6

5

iOS26.2正式版来了升级后锁屏界面可以调节LiquidGlass的不透明程

6

荣耀Magic8降价突袭！16+512G仅3824元，比首发省1200元✅优惠

7

没想到Magic8系列后面还有4款，分别是Magic8S、Magic8Air

8

nova15Ultra版本和Mate80标准版对比下来，可能Mate80标准版能

9

有些网友觉得现在iPhone16Pro只要4999了，国产旗舰机的压力又大了不

10

荣耀顶级旗舰看头不小啊！！刚刷到荣耀Magic8RSR的爆料，我直接瞳孔

科技最新文章

1

想买苹果手机的等等吧，新iPhone要来了看爆料，新款iPhone17e明

2

iPhone18最新爆料，这也太炸裂了苹果经典的提前大半年爆料，iPhon

3

影石十万元悬赏黑公关影石公司近日因旗下首款全景无人机“影翎Antigravi

4

ho,完全基于当前爆料参数的iPhone折叠3D打印机模出炉，展开7.76寸闭

5

据路透社报道，英伟达已告知中国客户，计划于2026年春节前向中国交付H200人工

6

感觉17Pro买早了，明年有这么多新iPhone！网上看到的爆料图，我天啊，明

7

nova15Ultra版本和Mate80标准版对比下来，可能Mate80标准版能

8

快手直播快手成快播，传播速度都很快，昨晚是太辣眼睛，作为一个体量较大的互联网平台

9

说实话，我是不太同情快手的遭遇，最主要的原因是因为我自己平时不太喜欢刷短视频，因

10

快手遭到黑灰产攻击这将引起的是大家对于快手的“信任的崩塌”！