DeepSeek发新项目了!但不是v4地址:github.com/deepsee

蚁工厂 2026-04-24 01:07:48

DeepSeek发新项目了!但不是v4地址:github.com/deepseek-ai/TileKernelsTileKernels: 为 LLM 操作优化的 GPU 内核,基于 TileLang 构建。TileLang 是一种领域专用语言,用 Python 表达高性能 GPU 内核,具备易于迁移、开发敏捷和自动优化等特点。

这个项目中的大多数内核,在计算强度和内存带宽方面都接近硬件性能上限。其中一部分已经用于内部训练和推理场景。不过,这些实现还不代表最佳实践,我们也在持续改进代码质量和文档。

从DeepSeek到前几天的Kimi,都还在不断做优化,还是缺卡啊。AI创造营How I AI

0 阅读:20
蚁工厂

蚁工厂

感谢大家的关注