转:
显证有两个事让我印象很深,
一个是孙字晨,他搞了个叫"无聊的猫"的项目,也没见什么技术白皮书,上线第一周流水就破了一百万。紧接着又推了DocpPal,BAl Law,层都是一个套路:到片 Token.另一个是傅盛,独豹移动工式推出"模型网关"服务,个APIKoy就能酒用全球主进大模型。他直接亮价格说自己的服务能做则同行的十七分之一。个币图最有争议的换盘手,一个互联同老兵。风格八竿子打不争,却可时冲进了同一个赛道。这录赛进叫"AI中转钻".它不造模型,不须算力,不成训练数据。听起来像个二道子?但仔细看,这个赛通正在疯狂吸金,吸人,吸注意力,它到底是什么?凭什么让这两个人同时转身?
一,刘底什么是Al中转站?
先还原一个真实场景。
你是开发者,您在自己产最里接入AI对请。你得办多少!?
注册海外账号,讲定海外信用卡(国内卡大概率被拒)自己搭代理解决网培问题。然后每个型的接口描式还不一样,OperAl一套,Clauce一套。Gocgle Gemini又是另一套。你想让用户自由逸楼型?每种写一遍适配代码,最后还要打仕API账单,GPT4调一次可前几毛关元,用户一多,账单哗哗的,
四个字:须,贵,难。
A中结站现是来到决这个愿的,它只于三件夏。
第一,看你运货,从OponAl,Anthropic这些厂商批量买Token,量大便宜,拿间折㧟。第二,替你修請,国内服务管直连,不用國范,支付也给你打通,第三,你统一接口,所有塑的差异全部流平,你只需要一个 APlKoy,就能酒所有主流模型,说自了,它把是质,分敏,遮用的A能力,变成了即插即用的东西,你不用关心背后是怎么接過的,你只负责用款行。
需要特别说明的是,这门生您是面向B端的。中转站的是API调用能力,本质上是开发者工具。它的客广户不是拿ChatGPT蒋天间问甦的普通用户,而是有开发能力的团队或个人,比如中小企业,独立开发者,大企业的技术部门,C舞用户直接用玻成的对活产品战行,用不管理API.
二,底层逻鳞:一个聪明的度系统
很多人一听"底层架构"就世得头大。换个说法你就怖了。你从广州寄个包要到纽约。你寄自赛不用自己安排飞机,不用处理海关,交给菜鸟驿站就行。Al中转站就是那个"菜鸟系统",只不过它通的不是包裏,是你的数据请求。它由四员组成。第一层,统一入口。你发一个请求过来,它先认你是谁,还有没有余额,然后转交给内部系统,第二层,智能路由,这是整个系统的大脑,它做几个判断:你预算有限就走受宣的便型,任务复杂杭用GPT4,宫方API突然变慢了航自动切到备用通道,同一个APlKey被胜流了就换下一个。所有这些你完全无感,它全自动苦你完成,第三层,协议转换,每家疫早的接口长得不一样。这一层负责团译,你只用一套参数,它帮你转成每个模量认得的格式第四层,计费加缓存。精请记录你用了多少Tokon,按量扣费。同一个问题如果别人间过,缓存直接返同结果,Token省钱。技术实现上,士流方京是基于Enwoy或者Cloudflare Gateway改造。真正的难点不在写那几百行代码,而在于让它稳定距起来。扛住突发说量,防住恶意攻击,应对上游厂商的限济和封号。很多人懂得这就是言个克。真正干过的人知遍:让一个网关做组00.9%可用,比写一个溪警还淮,三,商业模式:三层钱法,一层比一层深怎么钱?从说到深有三层,
第一层,批零差价,大客户线量采购的拿到20%到50%的折扣。中转站把几十个中小客户的需求凑在一起去找厂商谈,拿到折扣后,再以官方价的七到九折零售出去。算笔账:进货成本官方价的五折,卖八折,毛利三十个百分点。月流水一百万,毛利三十万。扫掉服务器和支付成本,纯利十五到二十万。这个是基础玩法。门不高,所以竞争也最激烈第二员,拉线过请费。有砖用户不想从中转站买Token,他们有自己为官方Key,但要统一接口和自动故障切换。中转贴不卖Token,只提供服务,每次调用袖成5%到10%。这个模式更轻,不用整资采购,但用户粘性低,时可以切走。
第三层,增值服务;乜是最深的护城巨。大企业客户愿意为"稳定"和"安全"付更高价钱。比如多账号热备 ,官到 是读,幼岁儿的 子,封一个自动换下一个,用户全程无感,再比如舌能路由策略,写邮件用受宝的使型,写代码用强的模型。用户省钱,中转站薄差价,还有数举缓存,合规审计等等,这那分利润率进高于卖Token,而且客户一旦用上就得迁移
这门生意的本质特征特别明要:边除成本极低,新增一个用户几手不加服务差成本:现金流极好,用户预充值,平台手里始终沉淀着一笔税;规模效应明显,用产越多,采购折扣越大,利满麟厚,典型的赢家通吃。
四,为什么孙写晨和得盎同时冲进来?
两个人目的完全不同,但看到了同一个底层趋势。
先说每盛,他之前说过一句话:"我们不会自研大模型,我们只做大楼型的搬运工。"当时很多人觉得这是自或者技术不够。现在回头看,他是在提前下注一个欧:大模型会长速商品化。价特越来超低,各家性能超来越栏同,真正精缺的不再是领型本身,而是低成本,低门的连接能力,豹移动手里正好有海外支付通道,全球服务举网培,大厦要运维经验。所以他做莫型网关,不是到界,是能力的自然延伸。
再说孙宇晨,他的玩法更激进。他那些项日底品都是AI中转站,但支付直接用USDT,而且加密货币的折扣比法币还大,为什么?第一,忘动成本极低,不用自研模型,不用买显卡,第二,预充值模式天然产生斑金沉游。这这些钱如果是总定市,可以喜接进DoFi生息。第三,注册在离岸地区,绕开国内监管。对孙字显来说,中转站本身不是终点,而是为他那个加医帝国获取真实应用场景和现金流的一把工員。两个人的判断其实是一样的:大模型巨在变成公共基础设施,你电力和带宽,模型感的利派会被竞争越压越薄,而连接层,也就是怎么让用户方便又便宜地用上这些模星,将拿是整个行业利润的人头。
五,光颜后的灰色高速常长的赛道,必然有见不得光的一面。第一种,黑广Token,部分小中转站用盗刚的信用卡买 API额度,成本几平为零,但风险根高,一旦被厂商发现,所有关联账号全都时禁,用户预充值的钱直接后零,数据也可能泄,第二种,模型降级糖诈。用户以为自己调的是GPT4.后台管偷换或了免费的Lama2,输出质量下降,用户还以为是自己的问题没写好,第三种,数据藻用,某些平台明文记录用户的每一次提问和回答,然后拿去调练自己的模型,或者转手安给第三方,这在OpenAl的服务条款里是明令禁止的这也是为什么正规军正在加速建立自己的垒:拿官方合作伙伴遗质,承诺数据不挖据,引入第三方审计,傅盛打的纸是"上市公司合规要语"这张牌,灰产吃的是短期红利,正规军吃的最长期信任。
六,谁在净钱?
训练大模型,需要几十亿美金,全中国酿玩的不到五家,做Al中转站,门槛迅得多,来钱也快得多,离用户近得多。
孙宇最看样了,傅感看择了,资本也在往里涌。下一次你用一个A应用,它后很可能不是直接还到 DpenAl的数运中心,面是过一个叫"中转"的中国层,那个名字也许今天还很小,但它正在成为兵家必争之地,挖金子的人永远在冒险,旁边卖工具的人反面赚得最稳。