【华为昇腾0day支持阿里Qwen3-VL-30B-A3B模型适配】“华

暨楠数码 2025-10-05 16:03:27

【华为昇腾 0day 支持阿里 Qwen3-VL-30B-A3B 模型适配】

“华为计算”公众号宣布，昇腾 0day 支持 Qwen3-VL-30B-A3B 模型适配。

昨日，阿里云通义千问 Qwen3 系列模型发布并开源其新一代多模态模型：Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct。Qwen3-VL 是一个多模态视觉语言模型系列，基于其前代产品，Qwen3-VL 在视觉理解方面实现了显著提升，同时保持了强大的纯文本处理能力。

主要增强功能：

视觉代理：操作 PC / 移动端图形用户界面 — 识别元素、理解功能、调用工具、完成任务。

视觉编码增强：从图像 / 视频生成 Draw.io/ HTML / CSS / JS。

高级空间感知：判断对象位置、视角和遮挡；提供更强的 2D 基础，并为空间推理和具身人工智能实现 3D 基础。

长上下文与视频理解：原生 256K 上下文，可扩展至 1M；能够处理书籍和数小时长的视频，具有完整回忆和秒级索引功能。

增强的多模态推理：在 STEM / 数学领域表现出色 —— 能够进行因果分析和提供基于逻辑与证据的答案。

升级的视觉识别：通过更广泛、更高质量的预训练，能够 " 识别一切 "—— 名人、动漫、产品、地标、动植物等。

扩展的 OCR 功能：支持 32 种语言（此前为 19 种）；在低光、模糊和倾斜情况下表现稳健；更好地处理罕见 / 古文字和专业术语；改进了长文档结构解析。

与纯 LLMs 相当的文本理解能力：无缝的文本-视觉融合，实现无损、统一的理解。

此前昇腾一直同步支持 Qwen 系列模型，此次 Qwen3-VL-30B-A3B-Thinking 和 Qwen3-VL-30B-A3B-Instruct 模型一经发布开源，即在 LLaMA Factory 和 vLLM 中开箱即用，实现模型的 0Day 适配。

值得一提的是，DeepSeek-V3.2-Exp 于 9 月 29 日发布并开源，引入稀疏 Attention 架构。华为当晚便宣布昇腾已快速基于 vLLM/SGLang 等推理框架完成适配部署，实现 DeepSeek-V3.2-Exp 0day 支持，并面向开发者开源所有推理代码和算子实现。