- 详细资料
- 分类:营销
- 发布于 2025年5月14日
特朗普政府正在为波斯湾两个重要盟友实现其人工智能AI雄心扫清道路——一些美国最大的科技公司正抓住这一机会,计划在该地区投入数十亿美元。
根据预计将于未来几天公布的与美国达成的协议,沙特和阿联酋势将获准更广泛地取得英伟达公司和AMD(112.46, 4.34, 4.01%)生产的先进AI芯片,它们的芯片被视为运行AI模型的黄金标准。
美国总统唐纳德·特朗普正在访问中东,这些交易也逐渐成形,他寻求建立更深层次的商业联系,并将美国在技术领域的计划放在中心位置。关于美国公司准备在该地区扩大项目的消息接连不断。
全球最大的半导体制造商英伟达将向沙特的Humain提供最先进的AI相关芯片,Humain将和AMD一道未来五年向AI基础设施投资100亿美元,亚马逊(211.37, 2.73, 1.31%)公司、思科(61.78, 0.11, 0.18%)系统公司、Alphabet旗下谷歌(160.89, 1.31, 0.82%)也分别在沙特有投资或合作计划。
据知情人士表示,特朗普政府正在考虑一项允许阿联酋进口超过100万枚英伟达先进芯片的协议,这一数量远超拜登时代AI芯片法规的限制。另据知情人士,OpenAI正考虑在阿联酋建设新的数据中心。
在特朗普访问该地区的第一天,这些AI领域的计划在众多投资项目中引人注目。在沙特首都利雅得,特朗普与王储穆罕默德·本·萨勒曼共同庆祝双方更紧密的商业关系。这些协议还包括扩大购买波音(203.42, 4.89, 2.46%)公司的客机,以及沙特承诺允许埃隆·马斯克的星链服务用于航空和海运。
- 详细资料
- 分类:营销
- 发布于 2025年3月03日
一篇DeepSeek披露利润率的文章却引来两家科技创业公司创始人“大打出手”。
3月1日,风头正劲的国产AI公司深度求索(DeepSeek)官方账号发布名为《DeepSeek-V3 / R1 推理系统概览》,在文章最后透露,“如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论上一天的总收入为56.2027万美元,成本利润率 545%。当然我们实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。”
这是DeepSeek官方首次公布成本利润率情况,此文一出,有网友在评论区@尤洋(编注:北京潞晨科技有限公司董事长)。
今年2月9日,尤洋曾在微博发文称,“MaaS (Model as a Service,编注:模型即服务,一种云计算服务模式)在中国短时间内可能是最差的商业模式。阿里云/百度云/腾讯云等相互内卷低价和免费,满血版的DeepSeek R1每百万token官方也只能收到16元……如果满血版的DeepSeek R1每日输出1000亿token,那么每月的机器成本是4.5亿,亏损4亿!用户越多,亏损越多。现金流能撑住吗?除非有免费的机器,但没有长久免费的午餐。”
2月28日,尤洋在回应网友提问“伯克利尤洋计算后认为卖DeepSeek API (MaaS)月亏损4亿,计算是否正确?离低成本有多远?”时再次强调,“结论:这个东西按照2025年2月初的状态不可能盈利。亏损来源:1. 测试速度和实际场景的差距。2. 机器利用率峰值和波谷的巨大差距。3. 机器的不稳定性。”
DeepSeek成本和收益
在被多名网友@后,3月1日,尤洋发文称,文章中的数据对计算MaaS成本没有任何参考价值,把DeepSeek网页,APP和MaaS API的token数加在一起计算,“我春节期间用过几次,问一个问题,然后说繁忙,让我稍后尝试,我等了15分钟或者一个小时。这本就不是一个合格的MaaS产品。”
3月1日下午,潞晨科技官微发文宣布将暂停DeepSeek API服务,“潞晨云将在一周后停止提供DeepSeek API服务,请尽快用完您的余额。如果没用完,我们全额退款。”
不过尤洋在3月2日凌晨又重新编辑,并强调“DeepSeek出圈前,2025年1月2日我就在微博上说过DeepSeek是中国最好的模型。我对DeepSeek没有任何贬低。我最开始就是抨击那些倒卖DeepSeek API去赔本赚吆喝的中小云厂商,然后吹嘘自己推理快10倍。现在我被友商引导到跟DeepSeek去对立。我说过,DeepSeek是很好很好的模型。”
根据潞晨科技微信公号,公司致力于解放AI生产力,通过高效多维并行、异构内存管理、大规模优化库、自适应任务调度等自研技术,打造面向大模型时代的通用深度学习系统 Colossal-AI,高效促进AI大模型落地应用,助力企业低成本实现AI智能化产业升级。潞晨两大产品Video Ocean和潞晨云已累计服务用户数超10万,公司付费客户总数突破2476家,其中包括4家世界500强企业和10家上市公司。公司2024年营收达7700万元。预计至2025年营收达1.5亿元,2026年预期增至3亿元。2月12日,潞晨科技宣布完成最新一轮融资,北京经济技术开发区产业升级股权投资基金参与本轮投资。
不仅仅是尤洋,在前述DeepSeek文章下面,硅基流动创始人袁进辉回复写道,“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert 组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
3月1日早间,尤洋再次发文称,“本人昨天情绪太冲动,说了一些让人误解deepseek infrastructure团队的话。deepseek infrastructure团队技术一流并给开源社区做出巨大贡献。本人诚挚道歉,已经删除不当表述,感谢大家提醒!”
值得注意的是,在2月初,袁进辉与尤洋两人就DeepSeek成本问题有过争论,袁进辉当时在朋友圈发文认为尤洋用了错误的架构进行估计,尤洋在微博写道,“回复一下袁进辉老师:我的测算已经考虑了很多很多用户把机器占满,单用户数字更难看。其实你就弄400台机器,看看每日能否输出1000亿满血DeepSeek R1 token,让我看看。或者40台机器能否输出满血400亿DeepSeek R1 token。不能的话,都是巨亏。我们用事实说话。”
这场原本还是围绕DeepSeek成本的讨论,在尤洋发出一篇名为《坑人的硅基流动》而“画风大转”,这篇已经被删除的文章提及,“这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我,他也在那里煽风点火。”
袁进辉随后对尤洋的多点问题进行回应,并在文末直言硅基流动被潞晨科技抄袭,只是为了给对方留个面子没有公开。尤洋也在朋友圈回应称,“代码都是潞晨CTO负责的,抄袭代码事件后,璐晨CTO离职,加入了袁进辉老师的公司。你说可笑不可笑?”
3月2日下午,被提及的原潞晨科技CTO方佳瑞也回应称,尤洋公司被袁进辉指出存在两次公开抄袭事件,尤洋想把第一次抄袭甩锅嫁祸于我,但铁证如山,本人身正不怕影子斜。
硅基流动官网显示,公司致力于打造规模化、标准化、高效能的生成式AI计算基础设施平台,提供模型云服务平台SiliconCloud、大语言模型推理引擎SiliconLLM、高性能文生图/视频加速库OneDiff等产品,助力企业和个人用户高效、低成本部署AI模型。2月1日,硅基流动宣布,大模型云服务平台 SiliconCloud首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。
两人在争什么?
两人这波争论源于DeepSeek公布的“成本利润率545%”。首先来看这个数字是怎么计算出来的,文中提到,“假定 GPU 租赁成本为 2 美金/小时,总成本为 $87072/天……理论上一天的总收入为 $562,027”,即545%的成本利润率仅仅是基于GPU的租赁成本。
尤洋在此后一篇解释的文章中指出,“DeepSeek这篇文章的数据是建立在大量用户把DeepSeek的APP和网页完全超负荷占满的情况下,不是一个常规的MaaS。阿里通义千问也很好,Kimi Chat也很好,豆包也很好,我不确定DeepSeek对他们是否有不可逾越的技术壁垒。”
尤洋认为,因为MaaS是ToB的,延迟和稳定性要求极高。要想留住客户,不能有任何疏忽。要想每日稳定输出1000亿token,需要准备输出5000亿token理论能力的机器。因为接的APP越多,机器利用率就越不可预测。
“时刻掉线或者延迟超过15分钟的MaaS哪个产品敢用?要不然为何各种大小云厂商全都要推出一体机吗?因为一体机是独占的,是最稳定的。”
尤洋认为,MaaS是ToB的,是服务APP,最大的问题是机器利用率的不确定性以及自己没有模型壁垒而承受的低毛利负毛利价格战。
袁进辉在DeepSeek回复中也提到,现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,“必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
在两人讨论最集中的知乎平台上,有不少网友认为尤洋和袁进辉的说法都有一定道理,袁进辉点赞的一篇关于DeepSeek成本讨论文章中写道,“DeepSeek收入估计肯定是虚高非常多的。因为这是所有业务的综合数据,官方并没有披露 API 的收费业务占了多少,其次,这里的价格是按R1计算的,官方也没有说V3/R1在真实业务中的比例。但是,考虑到他们至少有将近 6 倍的利润,如果 V3:R1 用量是 2:1,那么只要 API 业务是免费用户业务的六分之一,DeepSeek 就能收支平衡。”
值得注意的是,去年还在深度求索任职的罗福莉,在2024年5月曾在知乎发文提到,“大家不用担心模型断更,也不用担心API涨价(目前就是大规模服务的价格,不亏本,利润率超50%)。”
(来源:澎湃新闻)
- 详细资料
- 分类:营销
- 发布于 2024年12月09日
OpenAI为期12天的年终“技术盛宴”已结束第二天的直播。从当地时间12月5日发布的“满血版”o1模型和最贵ChatGPT Pro服务,到6日发布的强化微调(Reinforcement Fine-Tuning),无不证明AI世界又将迎来一次全新的产品升级和迭代。
在AI的狂欢中,其他科技公司也不甘示弱。有着“AI教母”之称的李飞飞创立的World Labs以及谷歌DeepMind团队本周先后发布重磅产品,让用户可以通过单张图片生成交互式3D场景,展示了AI在虚拟世界构建领域的巨大潜力。
Meta和马斯克的xAI也来凑了个热闹。Meta推出了今年的压轴AI大模型:Llama 3.3 70B,该模型据称能实现和Meta最大Llama 模型——Llama 3.1 405B同样的性能,成本还更低。xAI宣布Grok从今天起全球免费,但有使用限制。免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。
随着各路玩家在AI领域竞赛的深入,AI的竞争焦点也转向了智能体和通用人工智能(AGI)。
据外媒6日的最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及告诉《每日经济新闻》记者,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”
当地时间12月5日,OpenAI为期12天的圣诞季特别活动开启。
在第一天的活动上,OpenAI发布了推理大模型o1的“满血版”和进阶模式,以及每月收费高达200美元(约合人民币1450元)的ChatGPT Pro订阅服务。
“满血版”o1的特征是,在回答用户提问时不是“脱口而出”,而是形成一个类似人类思维方式的内部思维链条。该模型已面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。
“满血版”o1比9月发布的预览版更快、更强大、更准确,同时增加了多模态输入(可以上传图片)的能力。OpenAI表示,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),而且在回答困难现实问题时,出现重大错误的概率减少了34%。
图片来源:X同时发布的ChatGPT Pro服务也引发了外界的广泛关注,每月200美元的订阅费是目前ChatGPT Plus定价的10倍。不过,用户可以无限量地使用o1模型(Plus用户当前有每周50条信息的限制),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式,该模式“使用更多的计算来为最难的问题提供最佳答案”。
次日,OpenAI打出活动“第二弹”,推出了强化微调(Reinforcement Fine-Tuning)。阿尔特(13.380, -0.51, -3.67%)曼表示:“强化微调,效果出奇地好;它是我2024年最大的惊喜之一。”
图片来源:X平台强化微调与标准微调不同,利用强化学习算法,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理,提升模型在特定领域任务中的推理能力和准确性。
据介绍,它甚至可以让简易版推理模型o1 mini的效果超过前一天刚发布的“满血版”o1。OpenAI预计将于2025年初公开发布强化微调功能。
除了OpenAI的首批年末“王炸”外,本周还有诸多AI相关的重磅产品出炉。
作为AI领域影响力最大的女性和华人之一,斯坦福大学教授李飞飞于当地时间12月2日公布了其首个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。
在World Labs网站的演示里,由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。World Labs的AI工具配备了可操控的滑块来调节模拟景深(DoF)与模拟推拉变焦(dolly zoom),当使用者将景深效果调至越强时,背景中的物体便会越发模糊,为整个视觉体验增添了更多层次感与真实感。
图片来源:World Labs推特截图但World Labs目前只向公众发布了关于该技术的博客,外界能够体验的功能极为有限,而且并未放出任何代码和模型。
在单图生成3D世界领域探索的还有谷歌。北京时间12月5日凌晨,谷歌DeepMind在官网发布了大型基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的游戏3D世界,标志着AI在虚拟世界生成领域的又一次突破。
图片来源:谷歌Deepmind官网截图简单来说,给Genie 2一张图片,它可以生成供人类游玩、可实时渲染、可控和可交互的无限3D世界,不需要借助任何游戏引擎。例如,输入“森林中的可爱人形机器人(22.460, 0.03, 0.13%)”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。
和Genie 1相比,Genie 2拥有长期记忆,即使是角色短暂离开画面,在重新进入视野后,依旧能被精准还原出来。
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及在接受《每日经济新闻》记者采访时表示,“从学术研究的角度来看,能否将文本意义上的世界模型与物理意义上的世界模型关联起来,把真正的物理世界进行建模,是AI技术能否取得突破的关键。”
World Labs和谷歌之后,Meta也来凑了个热闹,于当地时间12月6日推出了今年的压轴AI大模型:Llama 3.3 70B。Meta 生成式AI副总裁 Ahmad Al-Dahle在X发帖表示,纯文本的 Llama 3.3能实现和Meta最大Llama模型——Llama 3.1 405B同样的性能,成本还更低。
Al-Dahle还附上了一张图表,显示包括针对大模型语言理解能力的测试MMLU在内,Llama 3.3在一系列行业基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI 的 GPT-4o和亚马逊本周稍早发布的Nova Pro。
图片来源:X随着大模型竞赛的深入,AI的风又更多地吹向了智能体和通用人工智能(AGI)。
吴及告诉每经记者,目前,尽管单个大模型在某些方面表现出色,但也存在诸多不足,例如幻觉和遗忘效应等问题。他强调,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”
吴及认为,智能体融合将成为AI应用解决特定场景问题的一个重要技术前景或发展方向。
在《纽约时报》于当地时间12月4日举办的DealBook峰会上,阿尔特曼表示,“智能体是现在每个人都在谈论的话题,我认为这背后是有充分理由的。设想一下,你可以让AI系统完成一项相当复杂的任务,比如需要一位非常聪明的人,花费一段时间,借助各种工具来完成并产出有价值成果的任务。我预计,这样的场景将在明年成为现实。”
他同时指出,AI行业即将迎来的发展将比预期更具冲击力。他将AI的影响力比作晶体管的发明,认为AI的推理功能未来将走向普及化和商业化。“到2025年,我们可能会首次见到具备AGI能力的系统。这类系统可以像人类一样完成复杂任务,甚至能运用多种工具来解决问题,”他说。
据外媒12月6日最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。根据目前的条款,当OpenAI创建AGI时,微软对这种技术的使用权将失效。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。
请 扫 描 这 个 二 维 码

看顶级财经网的精选内容!
