小米这次动静不小。之前高薪从Deepseek挖来的大牛罗福莉,看来是真派上用场了。她带着团队搞的新模型MiMo-V2-Flash,昨天直接发布还开源了。 这罗福莉自己也出来发了解读,能看出来这项目就是她主导的。从报告格式到技术思路,都还带着点以前在Deepseek的影子,不过重点不一样。外行看热闹,内行看门道。不少圈里人看了都说,虽然模型还没接上强化学习那些更高级的玩意儿,但路子走得很对,很“小米”。 啥路子呢?就是特别注重效率和实用性。一个是追求速度快、推理成本低,另一个是让模型“记性好”,能处理很长的背景信息。说白了,就是不整那些虚头巴脑的,先搞出个又快又省、还能干实活的模型,这很符合小米一贯的打法。 当然,从他们的训练数据也能看出现在行业的普遍问题。为了练这个模型,他们用了超过32万个各种各样的专门任务,有真代码,有合成的搜索任务,还有纯合成任务。这说明啥?说明现在大模型想在某些方面表现好,很大程度上还得靠海量的、针对性极强的人工“喂数据”,离那种真正像人一样能举一反三的“通用智能”还有距离。这活儿,既费钱又费工程师。 所以,罗福莉的水平肯定是够硬的,她来了之后,小米在AI大模型这块确实有了能讲故事的东西,下一步估计是要往端云协同的智能体(Agent)方向发展。但话说回来,现在AI模型竞赛太疯狂了,谷歌、阿里那些巨头,是靠着成千上万个天才在堆资源。小米想靠一个或几个顶尖人才就冲到最前排,短期内还不现实。 至于有人说,罗福莉会不会成为小米下一个像雷军那样的技术代言人,我觉得想多了。技术大牛和公司形象代言人,完全是两码事。她的价值是在幕后把技术和团队带起来,而不是到台前去讲故事。小米这钱花得值,是值在实打实的技术推进上,不是为了造星。




开拓者的眼光
不好意思,实在是最近风声紧,也没有什么能拿出手的,只好用这个女的和半吊子模型出来凑个数!