我的单3090显卡在llama.cpp的256K上下文跑出51token/s：

团团谈美好科技 2026-05-27 11:18:21

我的单3090显卡在llama.cpp的256K上下文跑出51 token/s： 1.把上下文拉到Qwen3.6-27B的256K极限了，可惜到不了1M。跑出50多token/s，已经非常优秀了，对单卡3090来说越来越香了。 2.最新版本llama.cpp的b330分支，前前后后有多项提升和优化，尽快更新。 3.我的配置RTX3090显存24G+32G运存+llama.cpp(b330)+win11+cuda13.1 4.单卡本地中等模型非常适合和均衡了

0 阅读：6

猜你喜欢

矿龙飞低价海外显卡店铺下架翻车了，到底是动了谁的蛋糕。刷到了很多狂龙飞低价海外

矿龙飞低价海外显卡店铺下架翻车了，到底是动了谁的蛋糕。刷到了很多狂龙飞低价海外

显卡

原来还有人跟显卡急啊

原来还有人跟显卡急啊

【5评论】【2点赞】

显卡技嘉用机技巧

矿龙飞显卡店铺商品下架，平台永久封杀，这次真是亏麻了。各位买了矿龙飞显卡的，退

矿龙飞显卡店铺商品下架，平台永久封杀，这次真是亏麻了。各位买了矿龙飞显卡的，退

【1评论】

显卡 it芯片

最顶级的显卡，往往需要最纯粹的散热方式

最顶级的显卡，往往需要最纯粹的散热方式

【1评论】【1点赞】

显卡

经典懂哥，1080十年前的老显卡了，拿什么跟5060比

经典懂哥，1080十年前的老显卡了，拿什么跟5060比

【15评论】【1点赞】

显卡

别以为买个固态硬盘你就会用，这里的水有点深买了新固态，速度却慢得离谱。不是硬

别以为买个固态硬盘你就会用，这里的水有点深买了新固态，速度却慢得离谱。不是硬

【3评论】【22点赞】

固态硬盘 bios sata dram 创投圈

装机天才少女，这个CPU装的很结实…

装机天才少女，这个CPU装的很结实…

【3评论】【1点赞】

CPU it芯片

团团谈美好科技

感谢大家的关注

作者最新文章

1

我的单3090显卡在llama.cpp的256K上下文跑出51 token/s：

2

lm studio的Beta版已经支持MTP加速： 1.相比于llama.cpp

3

llama.cpp的MTP方式真的值得部署： 1.我的硬件配置RTX3090 微

4

Openclaw2026.5.18版本: 1.全新能力（Android 语音模式

5

iPhone 16Pro的电池现状： 1.还有三个月就两年了，电池干到89%了，

6

推荐使用国产大模型而不是受限制的国外模型： 1.其实发现身边很多的公司和程序员都

7

Deepseek的V4版本写代码有点烧钱： 1.我用opencode 调用Dee

8

听说Qwen3.6-35B-A3B有点强: 1.最近qwen3.6系列亮相，只开

9

openclaw小龙虾最近更新很频繁： 1.近两周连续多天快速更新，出现过两次打

10

Minimax-M2.7大模型开源了： 1.这款大模型在国外很火，现在开放本地部

科技TOP

1

库克也找马斯克合影，马斯克是不是白的喝多了有人说这俩都从美国来的，在中国合影干啥

2

成功了，俄罗斯光刻机终于研发出来了！俄罗斯ProgressSTP-350光刻机

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

魅族懵了！小米也懵了，第一个把副屏干成"奢侈品"的，居然是荣耀！磁吸副屏终于来

5

我也越来越像个“旁观者”……用过功能机、翻盖机，也见过智能机怎么一步步把生活

6

华为放大招！麒麟2026+韬定律，彻底跳出芯片卡脖子！刚从ISCAS2026现

7

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

8

贾跃亭又拿到7000万美元投资贾跃亭又拿到了7000万美元的融资，目标是五年内在

9

80后真的见证了时代巨变用过算盘、计算器、DOS、win95、98、2000、X

10

兄弟们，摩托罗拉motorazr70Ultra正式发布，直接7499起

科技最新文章

1

雷鸟GTMax售价2599元、雷鸟GT售价1899元。雷鸟GT

2

空调并不是开26度最省电开空调本就是为了凉快舒适，调到27、28度不冷不热，

3

最近两天，荣耀手机连续“翻车”，5月25日国行版荣耀600系列发布会公布价格时，

4

惊现名场面！荣耀500和荣耀600还是迎来了同台竞技，不过还是荣耀500出手狠辣

5

这次真不割韭菜！以前买华为nova，总被调侃“人傻钱多”，三千块买个中端机，

6

618还没结束，东哥家调整了iPhone17Pro、iPhone17Pr

7

荣耀300Pro，降频版骁龙8Gen3，发售价3399元起荣耀400Pro

8

曝iPhone20外观史诗级更新如果iPhone20真长这样，我第一反应不是买

9

iPhone20原型机偷跑太扯了，你这搞得我都恍惚了，一时间不知道最新的是iP

10

华为这次在上海IEEEISCAS2026上由何庭波提出“韬/Tau（