Deepseek表示,新方法可以更高效、更便宜地训练人工智能。 据报道,

哇侯选评汽车 2026-01-05 08:51:49

Deepseek表示,新方法可以更高效、更便宜地训练人工智能。 据报道,中国人工智能公司Deepseek推出了一种新的训练方法——流形约束超连接(mHC),这将使更高效、更低成本地训练大型语言模型成为可能。 该方法是所谓的Hyper Connections的进一步发展,最初由Bytedance于2024年开发。反过来,这项技术建立在微软亚洲研究院的经典ResNet架构之上。 Deepseek表示,由于在基础设施层面进行了特定的优化,mHC在不增加计算成本的情况下提供了更稳定和可扩展的训练。研究人员已经在多达270亿个参数的模型上测试了这项技术,并取得了积极的结果。这种新方法可能是Deepseek下一个大型机型发布的预演。AI多模态搜索 ai个性化训练

0 阅读:14
哇侯选评汽车

哇侯选评汽车

感谢大家的关注