AI资讯速报 · 2026年4月10日

📰 公众号文章列表（含摘要与链接）

机

机器之心

7篇 · 24h内

1	4步生图封神，GenEval从61%狂拉到92%，全面超越GPT-4o的TDM-R1模型来了港科大唐靖团队、港科大（深圳）胡天阳、小红书hi-lab罗维俭提出通用强化学习框架TDM-R1，利用不可微奖励对少步扩散模型进行RL微调，仅4步生成即可在GenEval上从61%飙至92%，超越GPT-4o。核心思路：通过轨迹分布匹配的确定性采样精确估计中间奖励，使少步模型获得组合生成能力。 15小时前
2	顶会论文抢先看！机器之心ICLR 2026论文分享会，下周六北京见机器之心将于下周六在北京举办ICLR 2026论文分享会，聚焦顶会最新研究成果，涵盖大模型、强化学习、多模态等方向，邀请一线研究者现场解读论文。 15小时前
3	告别直接生成，文生图进入Agent时代：港中文联合伯克利开源Gen-Searcher 港中文MMLab联合UC Berkeley、UCLA提出Gen-Searcher，首次为图像生成任务训练"深度搜索"智能体。模型在生成前先进行信息获取和知识检索，解决传统文生图在真实世界知识、最新信息场景下"直接出图"翻车的问题。同步开源评测基准KnowGen（630条人工验证样本）。 20小时前
4	让你「鞭打」Claude，被Anthropic直接发「律师函」了吧开发者创建名为"badclaude"的整活项目，用"数字鞭子"互动方式督促Claude干活，吸引数百万人围观。Anthropic随即发出停止侵权通知函，要求立即停止使用"Claude"、"Anthropic"品牌标识及暗示关联的表述，引发社区对AI品牌保护边界的热议。 20小时前
5	清华发布AutoSOTA：一周刷新105个顶会SOTA，推动AI科研回归创新本质清华大学发布AI科研自动化系统AutoSOTA，通过多智能体协作实现从思路生成到实验执行的端到端自动化，仅用一周即刷新105个顶会模型记录。核心价值：将科研人员从重复性超参优化和SOTA刷新中解放，推动AI科研回归需要创新思维的原创性工作。 23小时前
6	读代码前先跑5个「Git命令」？方法火了，网友却吵起来了工程师Ally Piechowski提出"先看Git再看代码"方法论：读代码前先跑5个Git命令——找出高频改动文件、识别核心贡献者、筛选Bug关键词提交、观察月度提交量、统计回滚频率，用提交历史给代码库做"诊断"。在Hacker News引发争议：支持者认为比盲目读文件高效，反对者指出Git数据可能误导、高变更≠高风险。 23小时前
7	帮普通人「驯服」Agent，这支硅谷初创团队冲上了X全球热搜硅谷初创公司Creao AI推出CREAO，让用户用自然语言描述需求即可生成可持续运行的Agent系统，无需编程基础。3月30日上线后冲上X全球热搜Top3，用户评价"AI终于走出聊天框"。核心突破：补足Agent"最后一公里"，将一次性对话固化为可复用自动化流程。 23小时前

新

新智元

7篇 · 24h内

1	多模态幻觉的病因「高熵节点」找到了！全基准幻觉率下降最新研究发现，多模态大推理模型的幻觉根源并非"没看见"，而是模型在生成because、however、wait等过渡词时处于高熵（高不确定性）状态，此时最易"想偏"。据此提出LEAD解码策略，通过熵感知在解码阶段抑制高熵节点的幻觉生成，全基准幻觉率显著下降。 1小时前
2	裸辞北大博士带17个Agent，49天造出全球首个AI开放世界！成本仅5000 北大美学博士刘耕裸辞后，率领17个AI Agent协作，49天完成30万行代码，仅花5000元打造出"AI开放世界"Elseland。该项目展示了多Agent协作的惊人生产力：一人即一个"超级军团"，被视为AI赋能个人创作者的标志性案例。 1小时前
3	一行代码，Claude成本直降85%！最强Opus做大脑，Sonnet疯狂搬砖开发者发现通过"Opus做大脑+Sonnet做执行"的分工模式，一行代码即可将Claude使用成本直降85%：用最强Opus负责规划和决策，用便宜的Sonnet执行具体任务。核心思路：将复杂任务拆解后分配给不同层级模型，兼顾质量与成本。 1小时前
4	狂揽4万星！换掉OpenClaw太爽了，5美元就能养个AI打工人 Nous Research推出开源Agent神器Hermes Agent，GitHub狂揽4万星，月费5美元即可部署24小时在线AI打工人，无缝接入Telegram、Discord、飞书等平台。核心特色："会跟着你成长的Agent"——能自主学习攒技能并反哺训练，被视为OpenClaw最强开源对手。 16小时前
5	Claude Opus 4.6差评如潮！思考深度暴跌67%，AMD总监6852次日志打脸 AMD AI总监在GitHub公开提交问题报告，基于6852次会话日志量化分析，指控Claude Code自2月更新后思考深度暴跌67%，模型从"优先研究"转向"优先编辑"，代码质量明显下滑。Anthropic调整默认值引发争议，用户质疑AI公司能否悄悄改动影响质量的参数——"你买下的不是智能，是随时可回收的体验"。 16小时前
6	刚刚，豆包「成精」了！一夜告别机械感，上亿人手机全量上线字节跳动Seed团队发布原生全双工语音大模型Seeduplex，已在豆包App全量上线。核心突破：实现"边听边说"，能识别用户思考时卡顿并适应，强抗噪能力，彻底消除AI语音机械感。这是业内首个规模化落地的全双工语音模型，上亿用户即时体验。 22小时前
7	开源屠刀！400美元炼成「代码副脑」，硅谷天价模型成废铁艾伦研究院推出Open Coding Agents，最低约400美元算力成本即可训练专属编程智能体，SERA-32B在标准编码测试表现优异，成本比传统方法便宜25倍以上。核心方法：采用软验证生成技术大幅降低训练成本，仅需40个GPU日（2块NVIDIA A100），让天价闭源编程模型性价比崩塌。 22小时前

智

智东西

5篇 · 24h内

1	智谱GLM-5.1到阿里龙虾全囊括！OpenClaw研讨会最终议程与大模型论坛嘉宾阵容同步公布 4月21-22日北京站OpenClaw研讨会最终议程公布，涵盖智谱GLM-5.1、阿里龙虾等主流模型，同步揭晓大模型论坛嘉宾阵容。活动聚焦Agent生态发展与模型落地实践，将展示OpenClaw最新应用场景与生态进展。 12小时前
2	DeepMind创始人最新专访：AGI或5年内实现，规模是工业革命10倍，上一波思想已被「榨干」谷歌DeepMind CEO Demis Hassabis接受20VC万字访谈，预测AGI将在5年内实现，社会冲击力或达工业革命100倍。指出算力是最大瓶颈，否认模型能力"商品化"论调，称约90%推动现代AI的突破来自Google系和DeepMind。认为当前Scaling Law仍有效，但"上一波思想已被榨干"，需新范式突破。 14小时前
3	林俊旸点赞，干翻字节Seedance 2.0的「欢乐马」模型，阿里造？代号HappyHorse-1.0的神秘视频生成模型在Artificial Analysis盲测中登顶，击败字节Seedance 2.0。据The Information报道，该模型由阿里淘天集团未来生活实验室开发（负责人张迪），150亿参数支持1080p+音频，是阿里全面对抗字节AI视频赛道的最新动作。字节Seed团队林俊旸点赞相关讨论。 14小时前
4	暴走30000步！我在85万平米的家博会里，挖出了AI家居的「真心脏」第57届广州家博会（85万㎡、5100+品牌）实地探访发现：AI已全面渗透家居产业链——从实时监控心率的智能床到鸿蒙底座链接的皮料加工车间，AI家居的"真心脏"不再是单一智能单品，而是以AI操作系统为核心的全场景联动平台，实现从制造端到消费端的全链路智能化。 23小时前
5	未来医生对话凯文·凯利：人类突破120岁的技术密码是什么？未来医生CEO王仕锐对话凯文·凯利，探讨医疗AGI如何帮助人类寿命突破120岁。凯利认为医疗AGI"一定会发生"，AI正从辅助诊疗进化为重构医疗体系的核心力量。关键信号：从DeepMind蛋白质折叠到医疗Agent密集布局，AI开始介入"生老病死"这一人类最核心命题。 23小时前