- 详细资料
- 分类:营销
- 发布于 2025年3月03日
一篇DeepSeek披露利润率的文章却引来两家科技创业公司创始人“大打出手”。
3月1日,风头正劲的国产AI公司深度求索(DeepSeek)官方账号发布名为《DeepSeek-V3 / R1 推理系统概览》,在文章最后透露,“如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为56.2027万美元,成本利润率 545%。当然我们实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。”
这是DeepSeek官方首次公布成本利润率情况,此文一出,有网友在评论区@尤洋(编注:北京潞晨科技有限公司董事长)。
今年2月9日,尤洋曾在微博发文称,“MaaS (Model as a Service,编注:模型即服务,一种云计算服务模式)在中国短时间内可能是最差的商业模式。阿里云/百度云/腾讯云等相互内卷低价和免费,满血版的DeepSeek R1每百万token官方也只能收到16元……如果满血版的DeepSeek R1每日输出1000亿token,那么每月的机器成本是4.5亿,亏损4亿!用户越多,亏损越多。现金流能撑住吗?除非有免费的机器,但没有长久免费的午餐。”
2月28日,尤洋在回应网友提问“伯克利尤洋计算后认为卖DeepSeek API (MaaS)月亏损4亿,计算是否正确?离低成本有多远?”时再次强调,“结论:这个东西按照2025年2月初的状态不可能盈利。亏损来源:1. 测试速度和实际场景的差距。2. 机器利用率峰值和波谷的巨大差距。3. 机器的不稳定性。”
DeepSeek成本和收益
在被多名网友@后,3月1日,尤洋发文称,文章中的数据对计算MaaS成本没有任何参考价值,把DeepSeek网页,APP和MaaS API的token数加在一起计算,“我春节期间用过几次,问一个问题,然后说繁忙,让我稍后尝试,我等了15分钟或者一个小时。这本就不是一个合格的MaaS产品。”
3月1日下午,潞晨科技官微发文宣布将暂停DeepSeek API服务,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”
不过尤洋在3月2日凌晨又重新编辑,并强调“DeepSeek出圈前,2025年1月2日我就在微博上说过DeepSeek是中国最好的模型。我对DeepSeek没有任何贬低。我最开始就是抨击那些倒卖DeepSeek API去赔本赚吆喝的中小云厂商,然后吹嘘自己推理快10倍。现在我被友商引导到跟DeepSeek去对立。我说过,DeepSeek是很好很好的模型。”
根据潞晨科技微信公号,公司致力于解放AI生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI,高效促进AI大模型落地应用,助力企业低成本实现AI智能化产业升级。潞晨两大产品Video Ocean和潞晨云已累计服务用户数超10万,公司付费客户总数突破2476家,其中包括4家世界500强企业和10家上市公司。公司2024年营收达7700万元。预计至2025年营收达1.5亿元,2026年预期增至3亿元。2月12日,潞晨科技宣布完成最新一轮融资,北京经济技术开发区产业升级股权投资基金参与本轮投资。
不仅仅是尤洋,在前述DeepSeek文章下面,硅基流动创始人袁进辉回复写道,“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert 组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
3月1日早间,尤洋再次发文称,“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒!”
值得注意的是,在2月初,袁进辉与尤洋两人就DeepSeek成本问题有过争论,袁进辉当时在朋友圈发文认为尤洋用了错误的架构进行估计,尤洋在微博写道,“回复一下袁进辉老师:我的测算已经考虑了很多很多用户把机器占满,单用户数字更难看。其实你就弄400台机器,看看每日能否输出1000亿满血DeepSeek R1 token,让我看看。或者40台机器能否输出满血400亿DeepSeek R1 token。不能的话,都是巨亏。我们用事实说话。”
这场原本还是围绕DeepSeek成本的讨论,在尤洋发出一篇名为《坑人的硅基流动》而“画风大转”,这篇已经被删除的文章提及,“这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我,他也在那里煽风点火。”
袁进辉随后对尤洋的多点问题进行回应,并在文末直言硅基流动被潞晨科技抄袭,只是为了给对方留个面子没有公开。尤洋也在朋友圈回应称,“代码都是潞晨CTO负责的,抄袭代码事件后,璐晨CTO离职,加入了袁进辉老师的公司。你说可笑不可笑?”
3月2日下午,被提及的原潞晨科技CTO方佳瑞也回应称,尤洋公司被袁进辉指出存在两次公开抄袭事件,尤洋想把第一次抄袭甩锅嫁祸于我,但铁证如山,本人身正不怕影子斜。
硅基流动官网显示,公司致力于打造规模化、标准化、高效能的生成式AI计算基础设施平台,提供模型云服务平台SiliconCloud、大语言模型推理引擎SiliconLLM、高性能文生图/视频加速库OneDiff等产品,助力企业和个人用户高效、低成本部署AI模型。2月1日,硅基流动宣布,大模型云服务平台 SiliconCloud首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。
两人在争什么?
两人这波争论源于DeepSeek公布的“成本利润率545%”。首先来看这个数字是怎么计算出来的,文中提到,“假定 GPU 租赁成本为 2 美金/小时,总成本为 $87072/天……理论上一天的总收入为 $562,027”,即545%的成本利润率仅仅是基于GPU的租赁成本。
尤洋在此后一篇解释的文章中指出,“DeepSeek这篇文章的数据是建立在大量用户把DeepSeek的APP和网页完全超负荷占满的情况下,不是一个常规的MaaS。阿里通义千问也很好,Kimi Chat也很好,豆包也很好,我不确定DeepSeek对他们是否有不可逾越的技术壁垒。”
尤洋认为,因为MaaS是ToB的,延迟和稳定性要求极高。要想留住客户,不能有任何疏忽。要想每日稳定输出1000亿token,需要准备输出5000亿token理论能力的机器。因为接的APP越多,机器利用率就越不可预测。
“时刻掉线或者延迟超过15分钟的MaaS哪个产品敢用?要不然为何各种大小云厂商全都要推出一体机吗?因为一体机是独占的,是最稳定的。”
尤洋认为,MaaS是ToB的,是服务APP,最大的问题是机器利用率的不确定性以及自己没有模型壁垒而承受的低毛利负毛利价格战。
袁进辉在DeepSeek回复中也提到,现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,“必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
在两人讨论最集中的知乎平台上,有不少网友认为尤洋和袁进辉的说法都有一定道理,袁进辉点赞的一篇关于DeepSeek成本讨论文章中写道,“DeepSeek收入估计肯定是虚高非常多的。因为这是所有业务的综合数据,官方并没有披露 API 的收费业务占了多少,其次,这里的价格是按R1计算的,官方也没有说V3/R1在真实业务中的比例。但是,考虑到他们至少有将近 6 倍的利润,如果 V3:R1 用量是 2:1,那么只要 API 业务是免费用户业务的六分之一,DeepSeek 就能收支平衡。”
值得注意的是,去年还在深度求索任职的罗福莉,在2024年5月曾在知乎发文提到,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本,利润率超50%)。”
(来源:澎湃新闻)
- 详细资料
- 分类:营销
- 发布于 2024年12月09日
OpenAI为期12天的年终“技术盛宴”已结束第二天的直播。从当地时间12月5日发布的“满血版”o1模型和最贵ChatGPT Pro服务,到6日发布的强化微调(Reinforcement Fine-Tuning),无不证明AI世界又将迎来一次全新的产品升级和迭代。
在AI的狂欢中,其他科技公司也不甘示弱。有着“AI教母”之称的李飞飞创立的World Labs以及谷歌DeepMind团队本周先后发布重磅产品,让用户可以通过单张图片生成交互式3D场景,展示了AI在虚拟世界构建领域的巨大潜力。
Meta和马斯克的xAI也来凑了个热闹。Meta推出了今年的压轴AI大模型:Llama 3.3 70B,该模型据称能实现和Meta最大Llama 模型——Llama 3.1 405B同样的性能,成本还更低。xAI宣布Grok从今天起全球免费,但有使用限制。免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。
随着各路玩家在AI领域竞赛的深入,AI的竞争焦点也转向了智能体和通用人工智能(AGI)。
据外媒6日的最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及告诉《每日经济新闻》记者,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”
当地时间12月5日,OpenAI为期12天的圣诞季特别活动开启。
在第一天的活动上,OpenAI发布了推理大模型o1的“满血版”和进阶模式,以及每月收费高达200美元(约合人民币1450元)的ChatGPT Pro订阅服务。
“满血版”o1的特征是,在回答用户提问时不是“脱口而出”,而是形成一个类似人类思维方式的内部思维链条。该模型已面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。
“满血版”o1比9月发布的预览版更快、更强大、更准确,同时增加了多模态输入(可以上传图片)的能力。OpenAI表示,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),而且在回答困难现实问题时,出现重大错误的概率减少了34%。
图片来源:X同时发布的ChatGPT Pro服务也引发了外界的广泛关注,每月200美元的订阅费是目前ChatGPT Plus定价的10倍。不过,用户可以无限量地使用o1模型(Plus用户当前有每周50条信息的限制),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式,该模式“使用更多的计算来为最难的问题提供最佳答案”。
次日,OpenAI打出活动“第二弹”,推出了强化微调(Reinforcement Fine-Tuning)。阿尔特(13.380, -0.51, -3.67%)曼表示:“强化微调,效果出奇地好;它是我2024年最大的惊喜之一。”
图片来源:X平台强化微调与标准微调不同,利用强化学习算法,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理,提升模型在特定领域任务中的推理能力和准确性。
据介绍,它甚至可以让简易版推理模型o1 mini的效果超过前一天刚发布的“满血版”o1。OpenAI预计将于2025年初公开发布强化微调功能。
除了OpenAI的首批年末“王炸”外,本周还有诸多AI相关的重磅产品出炉。
作为AI领域影响力最大的女性和华人之一,斯坦福大学教授李飞飞于当地时间12月2日公布了其首个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。
在World Labs网站的演示里,由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。World Labs的AI工具配备了可操控的滑块来调节模拟景深(DoF)与模拟推拉变焦(dolly zoom),当使用者将景深效果调至越强时,背景中的物体便会越发模糊,为整个视觉体验增添了更多层次感与真实感。
图片来源:World Labs推特截图但World Labs目前只向公众发布了关于该技术的博客,外界能够体验的功能极为有限,而且并未放出任何代码和模型。
在单图生成3D世界领域探索的还有谷歌。北京时间12月5日凌晨,谷歌DeepMind在官网发布了大型基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的游戏3D世界,标志着AI在虚拟世界生成领域的又一次突破。
图片来源:谷歌Deepmind官网截图简单来说,给Genie 2一张图片,它可以生成供人类游玩、可实时渲染、可控和可交互的无限3D世界,不需要借助任何游戏引擎。例如,输入“森林中的可爱人形机器人(22.460, 0.03, 0.13%)”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。
和Genie 1相比,Genie 2拥有长期记忆,即使是角色短暂离开画面,在重新进入视野后,依旧能被精准还原出来。
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及在接受《每日经济新闻》记者采访时表示,“从学术研究的角度来看,能否将文本意义上的世界模型与物理意义上的世界模型关联起来,把真正的物理世界进行建模,是AI技术能否取得突破的关键。”
World Labs和谷歌之后,Meta也来凑了个热闹,于当地时间12月6日推出了今年的压轴AI大模型:Llama 3.3 70B。Meta 生成式AI副总裁 Ahmad Al-Dahle在X发帖表示,纯文本的 Llama 3.3能实现和Meta最大Llama模型——Llama 3.1 405B同样的性能,成本还更低。
Al-Dahle还附上了一张图表,显示包括针对大模型语言理解能力的测试MMLU在内,Llama 3.3在一系列行业基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI 的 GPT-4o和亚马逊本周稍早发布的Nova Pro。
图片来源:X随着大模型竞赛的深入,AI的风又更多地吹向了智能体和通用人工智能(AGI)。
吴及告诉每经记者,目前,尽管单个大模型在某些方面表现出色,但也存在诸多不足,例如幻觉和遗忘效应等问题。他强调,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”
吴及认为,智能体融合将成为AI应用解决特定场景问题的一个重要技术前景或发展方向。
在《纽约时报》于当地时间12月4日举办的DealBook峰会上,阿尔特曼表示,“智能体是现在每个人都在谈论的话题,我认为这背后是有充分理由的。设想一下,你可以让AI系统完成一项相当复杂的任务,比如需要一位非常聪明的人,花费一段时间,借助各种工具来完成并产出有价值成果的任务。我预计,这样的场景将在明年成为现实。”
他同时指出,AI行业即将迎来的发展将比预期更具冲击力。他将AI的影响力比作晶体管的发明,认为AI的推理功能未来将走向普及化和商业化。“到2025年,我们可能会首次见到具备AGI能力的系统。这类系统可以像人类一样完成复杂任务,甚至能运用多种工具来解决问题,”他说。
据外媒12月6日最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。根据目前的条款,当OpenAI创建AGI时,微软对这种技术的使用权将失效。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。
- 详细资料
- 分类:营销
- 发布于 2024年12月04日
近年来,随着电动汽车和高端消费电子产品需求的不断增长,电池技术的升级换代成为行业关注的焦点。而考虑到安全性和能量密度等因素,固态电池凭借其显著优势逐渐进入市场视野,成为全球电池技术发展的热点。
据中商产业研究院统计,2023年,全球固态电池出货量约为1GWh,渗透率仅约0.1%。到2030年,预计全球固态电池出货量将增长至614.1GWh,全球电池市场渗透率有望增长至10%。
作为下一代电池技术的“明星”,固态电池赛道吸引了大量资本和技术投入,商业化进程不断提速。近日,多家上市公司、动力电池和材料供应商纷纷披露固态电池领域最新进展。12月3日,光华科技(22.030, 1.34, 6.48%)、普路通(8.540, -0.34, -3.83%)等固态电池概念股涨停。
上市公司积极布局
中国固态电池市场正处于快速发展阶段,市场潜力巨大。根据中商产业研究院预测,2024年中国固态电池市场空间将达到17亿元,2030年将增至200亿元。
清华大学战略新兴产业研究中心副主任胡麒牧在接受《证券日报》记者采访时表示:“固态电池具有高能量密度和优异的安全性,解决了传统液态锂电池面临的一些瓶颈问题,因此在电动汽车及高端消费电子产品领域,固态电池的应用前景广阔。”
多家上市公司纷纷加码布局固态电池市场。12月3日,先导智能(23.210, -0.50, -2.11%)在投资者互动平台上表示,公司是拥有完全自主知识产权的全固态电池整线解决方案服务商,已成功打通全固态电池量产的全线工艺环节,实现了从整线解决方案到各工段的关键设备覆盖。
同日,南都电源(18.690, -0.37, -1.94%)表示,固态电池项目公司已经上报验收申请,将严格按照项目验收程序执行,预计第四季度验收完成。结合目前公司固态电池的技术特性,已在积极对接相关公司。
除上述公司外,12月2日,还有7家上市公司通过投资者互动平台透露了自己在固态电池领域的布局。德尔股份(24.970, -1.11, -4.26%)表示,公司在上海建立的固态电池试制生产线,预计于2024年底前完成;光华科技则表示,已拥有300吨固态电池用的硫化锂生产线,并有扩产计划。此外,长阳科技(18.720, -0.38, -1.99%)、大东南(2.960, 0.04, 1.37%)、美联新材(9.730, 0.00, 0.00%)、万向钱潮(6.580, -0.09, -1.35%)等企业也已在固态电池相关领域展开布局,涵盖电解质复合膜、铝塑膜等关键材料的研发与生产。
不仅是技术研发,生产制造的产能布局也在迅速推进。根据GGII统计,固态电池投资规划总金额已超过2000亿元,规划产能超400GWh。随着大量资金和政策的支持,固态电池产业链逐步成型,公开数据显示,超过200家企业进入这一领域,其中60多家企业专注于固态电解质的研发。
宁德时代(257.640, -4.20, -1.60%)、欣旺达(23.220, -0.43, -1.82%)等产业巨头在固态电池研发方面的投资也在加速。宁德时代今年增加了对全固态电池的研发投入,已将全固态电池研发团队扩充至超1000人,主攻硫化物路线,近期已进入20Ah样品试制阶段。欣旺达第一代半固态电池已经完成开发,第二代半固态电池的电芯样品已经开始中试试验,第三代聚合物复合全固态电池已完成实验室验证,预计2025年完成产品开发。
此外,还有多家车企公布固态电池相关业务进展。日产计划2024年内启动试点工厂,丰田、宝马等均计划于2030年实现量产。上汽集团(18.780, -0.15, -0.79%)日前在互动平台上表示,计划于2026年量产新一代固态电池。
胡麒牧表示:“随着产业布局的加速和技术突破的不断推进,固态电池有望在未来几年迎来爆发式增长。”
持续推进商业化进程
尽管固态电池产业发展提速,但其商业化进程仍然面临一系列挑战。
目前,固态电池仍未涌现出确定性的技术线路。据GGII统计,超六成企业布局多种技术路线,其中硫化物占比约40%,氧化物比例达到35%,其余则为其他技术。
从市场来看,硫化物未来潜力最大,头部电池厂商均重点布局。国内的宁德时代、比亚迪(282.020, -0.63, -0.22%)、华为,日本的丰田、松下,韩国的三星SDI、LG新能源、SKOn,美国的QuantumScape、Solid Power等均重点布局硫化物体系。
其中,日本押注硫化物路线,研发布局较早,技术和专利全球领先,打造车企和电池厂共同研发体系,政府资金扶持力度超2千亿日元,力争于2030年实现全固态电池商业化,能量密度目标500Wh/kg。韩国选择氧化物和硫化物路线并行,目标于2025年至2028年开发出能量密度400Wh/kg的商用技术,2030年完成装车。欧洲以聚合物路线为主,同时布局硫化物路线。美国全路线布局,目标在2030年达到能量密度500Wh/kg。
相比之下,国内固态电池的发展起步稍晚,但近年来随着政策支持和行业迅速发展,市场形势发生重要变化。胡麒牧表示,从国内来看,主流电池供应商如宁德时代以及电动车企业都在加大投入,力图尽快商业化。从政策层面来看,我国将固态电池列为重点研发技术,给出了配套的研发支持。目前固态电池商业化面临的问题主要是成本高和功率低,而随着技术的不断迭代以及应用的推广,这些问题都将被解决。
首都科技发展战略研究院特聘研究员董晓宇对《证券日报》记者表示:“从全球看,全固态电池产业化节奏加快。国内全固态电池的材料体系基本定型,目前的主要问题在于成本较高,制约全固态电池商业化进程。但国内主流厂商已实现了小批量量产,主要以示范运营为主,后续随着工艺、设备突破后,成本有望大幅降低。”
请 扫 描 这 个 二 维 码
看顶级财经网的精选内容!