🤖 AI资讯速报

2026年4月24日 · 午间版
31
篇精选
7
深度分析
24h
滚动更新
🤖
机器之心
10篇
🔥重磅📊深度DeepSeek-V4预览版正式上线并开源!百万上下文+Agent能力
DeepSeek-V4预览版正式上线并同步开源。百万字超长上下文,Agent能力、世界知识和推理性能三大维度国内与开源领域领先。分为pro和flash两个版本,API服务已同步更新。首次打通华为Ascend算力,同时保持英伟达生态兼容。开源策略继续:模型权重+技术报告全面开放。
📊 深度分析
🇨🇳 看中国DeepSeek-V4与GPT-5.5同日发布,中国AI不再只是跟随者。百万上下文+Agent能力+华为Ascend支持,标志国产大模型进入全栈自主阶段。开源策略继续为中国AI生态输血。
💻 看技术百万上下文是V4的核心卖点,配合Agent能力形成「超长记忆+自主执行」组合拳。华为Ascend适配意味着训练推理不再完全依赖英伟达,国产算力链打通。
🎯 看自己DeepSeek开源=免费获得顶级模型能力。AI创业者应立即评估V4在自身场景的表现,特别是长文档处理和多步推理任务。API成本可能远低于GPT-5.5。
⚔️ 看竞争V4 vs Qwen3.6-27B vs MiMo-V2.5,国产开源模型三强争霸。DeepSeek的品牌势能和开源社区活跃度仍是优势,但Qwen的稠密架构在中小参数段更实用。
⚠️ 看风险预览版≠正式版,稳定性和性能可能还有差距。百万上下文的实际推理速度和成本需实测验证。华为Ascend生态成熟度不如CUDA,迁移成本需评估。
🚀 看机会基于DeepSeek-V4的垂直Agent产品、长文档分析SaaS、国产算力适配服务都是创业机会窗口。特别是华为Ascend生态的开发者工具链尚处早期。
🎬 动作:立即测试DeepSeek-V4 API(deepseek-v4-pro/flash),评估百万上下文在实际业务场景的效果,关注华为Ascend适配进展。
🔥重磅📊深度国产具身世界模型「破晓时刻」!中科第五纪FlowWAM登顶全球榜单,斩获双料第一
中科第五纪FlowWAM在WorldArena全球榜单物理遵循和3D准确度两大维度均获第一,标志国产具身世界模型在物理空间认知能力上的突破。具身智能正从「视觉模拟」跨入「空间理解」新阶段。中国团队在全球具身世界模型竞争中占位前列。
📊 深度分析
🇨🇳 看中国FlowWAM双料第一证明中国具身世界模型已具备全球竞争力。结合它石智航4.55亿融资,中国在具身智能「大脑」层正在形成集群优势。中科院自动化所的学术转化能力值得关注。
💻 看技术物理遵循+3D准确度是具身世界模型的核心指标。FlowWAM的成功说明:理解物理规律(而非仅模拟视觉)是机器人从实验室走向真实场景的关键技术突破。
🎯 看自己具身世界模型的成熟将大幅降低机器人应用开发门槛。关注FlowWAM是否开源/提供API,如果能直接调用世界模型能力,可快速构建垂直场景的机器人应用。
⚔️ 看竞争FlowWAM vs 谷歌Genie vs 自变量WALL-B,全球具身世界模型竞争白热化。中国团队在WorldArena上的整体表现强劲,不只一家在前列。
⚠️ 看风险WorldArena是新兴评测,榜单排名与真实场景表现可能有差距。从模型到可部署的机器人系统还有很长的工程化路径。
🚀 看机会基于具身世界模型的垂直机器人应用(仓储/清洁/安防)是落地窗口。关注FlowWAM的开放策略和生态建设进展。
🎬 动作:关注FlowWAM的开源/API计划,评估在其基础上构建垂直机器人应用的可行性。跟踪WorldArena榜单变化。
突破算力瓶颈!港大俞益洲团队发布首篇「高效视频世界模型」全面综述
港大俞益洲团队发布首篇聚焦「高效性」的视频世界模型综述,从理论潜力与庞大计算成本的鸿沟出发,系统梳理高效架构设计、训练策略和推理优化方法。从Sora到Seedance,视频世界模型正从「鬼畜」走向「物理引擎」,但算力瓶颈是决定其能否实用的关键。
🔥重磅刚刚,DeepSeek开始频繁更新:Tile Kernels、DeepEP V2
DeepSeek GitHub频繁更新:开源Tile Kernels(LLM操作优化的GPU kernels,基于TileLang构建)和DeepEP V2(MoE分布式通信优化)。距离上次Mega MoE、FP4 Indexer更新不到一周。密集开源为V4正式版预热,推理成本天花板被进一步砸低。
🔥重磅姚顺雨带队、Hy3 preview上线!腾讯混元重建后首个大模型
腾讯混元Hy3 preview发布并开源。295B总参/21B激活/256K上下文,快慢思考融合MoE。姚顺雨归国加盟后首秀,遵循「AI应更小更实用」理念。在复杂推理、指令遵循、代码、Agent能力上大幅提升。混元重建后训练的第一个模型。
首篇「Attention Sink」综述:从利用、理解到消除,Transformer中的注意力汇聚全景
几乎所有Transformer都把大量注意力集中到少数特定Token上——这不是bug而是固有特性「Attention Sink」。首篇系统性综述从利用、理解到消除三个维度全面梳理,对优化推理效率、减少KV Cache有重要实践价值。
CVPR 2026 | 告别倾听「扑克脸」,UniLS框架刷新数字人对话SOTA
CVPR 2026论文UniLS框架解决数字人对话中的「扑克脸」问题,实现自然倾听表情生成,刷新数字人对话SOTA。对虚拟主播、AI客服等场景有直接应用价值。
🔥重磅蒸馏所有员工:Meta强制收集鼠标键盘输入训练AI,社区炸了
Meta向美国员工电脑安装MCI追踪软件,捕捉鼠标移动、点击、键盘输入及定期截屏,用于训练办公AI智能体。路透社和Business Insider曝光。员工和社区强烈反弹,隐私边界被彻底打破。刻意绕开欧洲GDPR。
🔥重磅天塌了,Pro用户用不了Claude Code,除非100美元买Max
Anthropic悄然将Claude Code从20美元Pro套餐移除,仅保留在100美元Max套餐。开发者社区强烈反弹,负责人急忙回应称仅小范围测试。高消耗AI编程Agent正逼迫平台重写订阅规则,按量计费趋势明确。
🔥重磅特斯拉开源硬件,中国团队开源大脑!首个具身智能顶配全家桶上线
特斯拉开源Optimus第三代灵巧手硬件专利后,智平方发布AlphaBrain Platform——全球首个一站式具身智能模型开源社区。世界模型、RL Token、持续学习算法等全链路开源。特斯拉开硬件、中国开大脑,具身智能进入开源新纪元。
新智元
11篇
🔥重磅📊深度GPT-5.5来了!全榜第一碾压Opus 4.7,OpenAI今夜雪耻
OpenAI深夜发布GPT-5.5(代号Spud),全方位碾压Claude Opus 4.7,重新夺回地表最强王座。Agent时代「原生大脑」,1M上下文,计算机任务、科学研究、代码全面领先。奥特曼称其为「全新级别的智能」。GPT-5.5融合GPT系列生成能力与o1结构化推理框架,是AGI冲刺前最后一次大规模基础模型重构。
📊 深度分析
🇨🇳 看中国GPT-5.5进一步拉大中美大模型差距,但DeepSeek-V4同日发布(百万上下文+Agent能力),中国玩家正在缩小推理性能差距。国内创业者应关注GPT-5.5的Agent范式如何本地化落地。
💻 看技术GPT-5.5核心突破在Agent能力:计算机操控、工具链调用、长程任务规划。1M上下文使长文档理解和多轮复杂任务成为可能。快慢思考融合架构(System 1+2)是关键创新。
🎯 看自己GPT-5.5定义了AI Agent的新标准——不是聊天,而是「接管电脑完成任务」。AI产品创业必须围绕这个范式重新定位:做垂直领域的Agent执行,而非通用对话。
⚔️ 看竞争GPT-5.5 vs Claude Opus 4.7 vs Mythos三强格局。OpenAI夺回基准测试王座,但Anthropic在编程Agent(Claude Code)和企业用户心智上仍有优势。差距在缩小而非拉大。
⚠️ 看风险GPT-5.5的Agent能力意味着AI可以自主操控计算机,安全性和可控性风险急剧上升。不怀好意者利用Agent自动化攻击的场景必须防范。
🚀 看机会基于GPT-5.5 Agent能力的垂直行业自动化工具(法律文书、财务分析、IT运维)是创业窗口。关键是找到GPT-5.5做不好但可以微调做好的垂直场景。
🎬 动作:体验GPT-5.5的Agent功能,评估在目标垂直行业的落地可行性,对比Claude Code和DeepSeek-V4的Agent能力。
🔥重磅📊深度1万亿美元!Anthropic估值暴涨,反超OpenAI
Anthropic在私募二级市场估值突破1万亿美元,达1.02万亿,反超OpenAI的8800亿。Forge Global平台数据显示,买家竞相抢购Anthropic稀缺股权。背后驱动:Claude Code产品势能、收入高增长、资本对AI平台入口的重新下注。OpenAI仍在亏损,预计2026年亏损140亿美元,现金流2030年才转正。
📊 深度分析
🇨🇳 看中国Anthropic估值超OpenAI,全球AI资本格局巨变。对中国AI创业者的信号:编程Agent(Claude Code)的变现能力被市场高度认可,这是可复制的商业模式。
💻 看技术估值倒挂的核心原因是Claude Code——编程Agent的ARPU远超对话产品。Anthropic证明了「AI做专业工作」比「AI聊天」值钱得多。这是技术路线的验证,不只是资本叙事。
🎯 看自己AI产品创业的核心启示:做工具而非做助手。Claude Code的成功证明,垂直领域深度工具的付费意愿远超通用对话。选准一个高价值垂直场景,做深做透。
⚔️ 看竞争Anthropic vs OpenAI的估值逆转只是开始。OpenAI正在IPO路上(1220亿融资+预计Q4上市),二级市场定价权之争将持续。微软+OpenAI vs 亚马逊+Anthropic的云AI联盟格局更加清晰。
⚠️ 看风险万亿估值建立在稀缺股权+预期之上,非公开市场流动性差。一旦Claude Code增长放缓或OpenAI发布更强的编程Agent,估值可能快速回调。
🚀 看机会AI编程Agent是当前最有确定性的创业方向。但不要做通用编程工具(与Claude Code正面竞争),而是做垂直行业的编程自动化:法律文书自动生成、金融报告自动撰写等。
🎬 动作:研究Anthropic收入结构(Claude Code占比),评估编程Agent在目标行业的落地可行性。关注OpenAI IPO时间线对市场情绪的影响。
🔥重磅📊深度OpenClaw,崩了!下载量腰斩、系统频崩、一键跑路代码被端
五周前老黄亲自站台封神的OpenClaw,现在连自家大厂都不敢装最新版。下载量从巅峰腰斩到一半,系统频繁崩溃,日更被骂惨,甚至「一键跑路」代码被端上GitHub。Anthropic封杀、社区分裂、质量失控——从「人类历史上增长最快的软件」到信任危机只用了5周。
📊 深度分析
🇨🇳 看中国OpenClaw危机对中国AI Agent生态是双刃剑:一方面验证了Agent操作系统的需求真实存在,另一方面提醒国产替代(如字节Coze、阿里百炼)需重视稳定性而非追新速度。
💻 看技术OpenClaw的问题根源:迭代速度>稳定性。日更模式导致每版引入新bug,核心功能(文件操作/代码执行)频繁崩溃。技术债务积累到不可控。这是所有开源Agent框架的前车之鉴。
🎯 看自己如果你正在基于OpenClaw构建产品,立即评估替代方案。开源项目的稳定性比功能丰富更重要。考虑Hermes Agent等更稳定的替代。
⚔️ 看竞争Anthropic封杀OpenClaw是关键转折——巨头从支持变封杀,Agent生态从开放走向割据。微软Copilot Studio、Google Jules等闭源Agent平台将受益。
⚠️ 看风险OpenClaw的信任危机可能蔓延到整个开源AI Agent领域。投资者和用户对「AI Agent」的信心受挫,短期可能影响所有Agent产品的融资和采用。
🚀 看机会「稳定版OpenClaw」或「企业级Agent操作系统」是巨大机会。市场需要的不是更多功能,而是更可靠的Agent运行环境。专注于稳定性而非功能的企业级Agent平台有机会。
🎬 动作:如果使用OpenClaw,评估迁移风险和替代方案。关注Hermes Agent等更稳定的开源Agent框架。如果做Agent产品,将稳定性作为核心卖点。
🔥重磅📊深度谷歌摊牌:75%新代码AI写!第八代TPU亮剑,老黄该急了
谷歌Cloud Next大会震撼反扑:第八代TPU首次拆分为训练专用TPU 8t和推理专用TPU 8i,性能狂飙3倍,Agent运行成本大幅降低。CEO劈柴发文称AI已写75%新代码。自研十年,正面硬刚英伟达GPU霸主地位。Virgo网络架构、9216芯片互联,训推分离架构是AI芯片新范式。
📊 深度分析
🇨🇳 看中国谷歌TPU训推分离架构对中国算力产业有参考价值。华为昇腾、寒武纪都在走类似路径。75%代码AI写的数据值得国产大厂学习——编程AI的采用率是工程效率的核心指标。
💻 看技术训推分离是关键创新:训练和推理对芯片的需求完全不同(训练重算力密度,推理重吞吐延迟),拆分后各自优化到极致。Virgo网络的9216芯片互联能力超越英伟达NVLink。
🎯 看自己AI算力成本是创业者最大的运营支出。谷歌TPU推理成本大幅降低,如果开放云服务,将直接降低AI产品的推理成本。关注Google Cloud的TPU推理服务定价。
⚔️ 看竞争谷歌TPU vs 英伟达GPU的算力战争进入新阶段。训推分离是差异化策略——英伟达的GPU仍是训推一体,谷歌通过专用化降成本。但英伟达的CUDA生态护城河仍然深厚。
⚠️ 看风险TPU仅限谷歌云使用,不像GPU可私有部署。对数据敏感的企业(金融/医疗)可能仍选GPU。75%代码AI写的数字可能包含AI辅助而非AI独立完成的代码。
🚀 看机会训推分离架构下的推理优化工具、TPU适配服务、成本优化咨询是新机会。关注Google Cloud TPU推理服务的价格竞争力。
🎬 动作:关注Google Cloud TPU 8i推理服务的定价和可用性,评估对AI产品推理成本的影响。学习75%代码AI写的工程实践。
🔥重磅📊深度4.55亿美金重注一颗「大脑」!红杉高瓴罕见联手
它石智航完成4.55亿美金Pre-A轮融资(超30亿人民币),创中国具身智能最大单笔融资纪录。高瓴创投与红杉中国联合领投,美团龙珠、中信产投等跟投。老股东全部跟投。赛道的胜负手不在本体硬件,而在谁能率先让机器人理解物理世界、自主完成任务——投的是「大脑」而非「躯壳」。
📊 深度分析
🇨🇳 看中国4.55亿美金Pre-A轮,中国具身智能融资新纪录。红杉+高瓴罕见联手,顶级资本用脚投票:具身智能的「大脑」(世界模型/规划算法)比「小脑」(运动控制)更值钱。这是中国AI产业升级的信号。
💻 看技术它石智航的技术核心是具身世界模型——让机器人在仿真环境中理解物理规律、自主规划动作。这比纯运动控制(翻跟头/跳舞)难几个数量级,但商业价值也大几个数量级。
🎯 看自己具身智能创业的资本信号很明确:投大脑不投躯壳。如果你在做机器人相关产品,应重点关注算法/模型层而非硬件层。具身世界模型是高价值赛道。
⚔️ 看竞争它石智航 vs 智元机器人 vs 自变量机器人,中国具身智能三强格局。它石智航融资最猛,但智元机器人商业化更早(已有合作部署)。资本≠商业化能力。
⚠️ 看风险Pre-A轮4.55亿美金,估值压力巨大。下一轮需要更惊人的进展才能支撑。具身智能的商业化周期长(3-5年),中间可能面临资本寒冬。
🚀 看机会具身智能的数据标注、仿真环境、测试工具链等基础设施服务有大量创业机会。不直接竞争本体/大脑,而是做生态服务商。
🎬 动作:关注它石智航的技术路线(世界模型架构),评估具身智能基础设施服务的创业机会。跟踪红杉+高瓴在具身智能领域的后续布局。
🔥重磅OpenAI版「龙虾」首次登场!不睡觉不离职,越PUA越聪明
OpenAI在ChatGPT正式上线workspace agents,Codex驱动,云端7×24运行,能存文件跑代码调用外部工具,有记忆和进化能力。GPTs全面升级版,5月6日前免费体验。企业AI Agent三国杀加剧。
🔥重磅13小时不眠不休,300个分身狂敲代码!开源第一易主了
Kimi K2.6出道即登顶开源榜,连续编码13小时、300个子Agent并行4000步,单次修改4000行代码。全栈交付能力(前端+后端+测试)让其成为「最强开源全栈工程师」。HLE 54.0%碾压GPT-5.4。
🔥重磅今天起,GPT Image 2要把全体设计师送走了
GPT Image 2.0全量上线,首个会「思考」的图像AI:联网搜索+推理生图,中文文字渲染准确率近99%,米粒刻字、UI截图生成、一致角色维持全面领先。设计工具链格局被彻底重塑。
🔥重磅3B激活参数!商汤绝影Sage登顶PinchBench,端侧第一
商汤绝影发布端侧多模态智能体基座大模型Sage,MoE架构32B总参/3B激活,PinchBench 94%任务完成率超Claude Opus 4.6和GPT-5.4。已在Orin X端侧部署,首字响应0.5秒。首款在车端实现复杂智能体能力的端侧基座模型。
OpenAI要吃掉全美6%电力?硅谷AI战火烧到了发电厂
泄露的投资人备忘录显示OpenAI正以30GW算力规划全面猎杀对手,预计明年飙升至十几GW。AI终极战争从实验室打到发电厂。0.5GW算力鸿沟逐年拉大,Anthropic算力顶峰7-8GW远不及。电力成为AI竞争的硬约束。
浙大开源多Agent演化系统:大圣棒打王熙凤,大观园沦为空城
浙江大学开源基于多智能体的演化叙事系统OpenStory,还原《红楼梦》角色和场景。实验揭示AGI下系统脆弱性。多Agent系统的涌现行为和不可预测性是AGI安全研究的重要参考。
📱
智东西
6篇
🔥重磅实测Qwen3.6-27B:4分钟做了个跑酷游戏,验证码识别正确率超90%
阿里通义开源Qwen3.6-27B,270亿参数稠密多模态模型,支持思考/非思考模式。以1/15参数规模在SWE-bench、Terminal-Bench等超越前代397B旗舰。4分钟完成跑酷游戏开发,验证码识别超90%。开源稠密模型性价比新标杆。
🔥重磅凌晨,GPT-5.5收复失地!Anthropic紧急出手
GPT-5.5发布后,Anthropic紧急调整产品策略应对。双方在Agent能力、编程、多模态全面对阵。GPT-5.5在基准测试领先,但Claude Code在企业编程场景仍占优。AI巨头军备竞赛进入白热化。
🔥重磅机器人这回真要进家当保姆了!世界统一模型登场
自变量机器人发布全球首个世界统一模型架构WALL-B,让机器人24小时在家庭场景持续理解世界并自我进化。形成「进家庭→获取数据→模型自我进化→再进更多家庭」的正向数据飞轮。一个月后首批机器人将入驻真实家庭。
🔥重磅DeepSeek V4发布前,罗福莉亮剑!小米MiMo-V2.5深夜突袭
小米MiMo大模型一口气官宣4款新模型:旗舰推理MiMo-V2.5、全模态Agent V2.5-Pro开启公测,V2.5-TTS语音合成、V2.5-ASR语音识别。前DeepSeek核心成员罗福莉带队,36天性能翻倍。AA榜与Kimi K2.6并列开源第一,百万上下文。
🔥重磅匿名大象模型被蚂蚁认领!推理速度冲到第一,还能生成百万小说
匿名模型Elephant Alpha正式揭晓为蚂蚁百灵Ling-2.6-flash。连续多日OpenRouter热榜第一,日均tokens 100B级别。推理速度极快,支持百万字小说生成。蚂蚁正式推出Ling-2.6-flash开源版。
不做老钱做闯将:宇视向企业「干活流程」开枪,发SOP智能体全家桶
宇视科技发布面向企业SOP的「阳关」多模态智能体平台,通过可驾驭的AI技术重塑企业核心业务流程。发布SOP智能体全家桶,涵盖视频分析、门禁管理、安防巡检等场景。AIoT企业向AI Agent转型的代表案例。
🏭
工信微报
2篇
🔥重磅中办、国办印发《关于更高水平更高质量做好节能降碳工作的意见》
中办国办联合发文,部署15项重点工作推进节能降碳和绿色转型。明确提出大力发展非化石能源和新型储能,加快建设新型电力系统。为「十五五」开局之年绿色转型提供纲领性指导。直接利好绿色电力和储能板块。
3月户均流量23.4GB创新高
工信部数据显示3月户均移动互联网接入流量达23.4GB创历史新高。流量增长驱动来自AI应用(视频生成/Agent交互)的带宽需求。通信基础设施持续扩容。
🌍
卢克文工作室
1篇
帝国的妖火
美国诺福克军港外「艾森豪威尔」号航母发生火灾,8名水兵受伤。一个月内两艘航母接连起火。卢克文深度分析美军军备维护危机——造船工业空心化、维修积压、人才断层,帝国军力的系统性衰退信号。