| 1 |
4步生图封神,GenEval从61%狂拉到92%,全面超越GPT-4o的TDM-R1模型来了
港科大唐靖团队、港科大(深圳)胡天阳、小红书hi-lab罗维俭提出通用强化学习框架TDM-R1,利用不可微奖励对少步扩散模型进行RL微调,仅4步生成即可在GenEval上从61%飙至92%,超越GPT-4o。核心思路:通过轨迹分布匹配的确定性采样精确估计中间奖励,使少步模型获得组合生成能力。
|
| 2 |
顶会论文抢先看!机器之心ICLR 2026论文分享会,下周六北京见
机器之心将于下周六在北京举办ICLR 2026论文分享会,聚焦顶会最新研究成果,涵盖大模型、强化学习、多模态等方向,邀请一线研究者现场解读论文。
|
| 3 |
告别直接生成,文生图进入Agent时代:港中文联合伯克利开源Gen-Searcher
港中文MMLab联合UC Berkeley、UCLA提出Gen-Searcher,首次为图像生成任务训练"深度搜索"智能体。模型在生成前先进行信息获取和知识检索,解决传统文生图在真实世界知识、最新信息场景下"直接出图"翻车的问题。同步开源评测基准KnowGen(630条人工验证样本)。
|
| 4 |
让你「鞭打」Claude,被Anthropic直接发「律师函」了吧
开发者创建名为"badclaude"的整活项目,用"数字鞭子"互动方式督促Claude干活,吸引数百万人围观。Anthropic随即发出停止侵权通知函,要求立即停止使用"Claude"、"Anthropic"品牌标识及暗示关联的表述,引发社区对AI品牌保护边界的热议。
|
| 5 |
清华发布AutoSOTA:一周刷新105个顶会SOTA,推动AI科研回归创新本质
清华大学发布AI科研自动化系统AutoSOTA,通过多智能体协作实现从思路生成到实验执行的端到端自动化,仅用一周即刷新105个顶会模型记录。核心价值:将科研人员从重复性超参优化和SOTA刷新中解放,推动AI科研回归需要创新思维的原创性工作。
|
| 6 |
读代码前先跑5个「Git命令」?方法火了,网友却吵起来了
工程师Ally Piechowski提出"先看Git再看代码"方法论:读代码前先跑5个Git命令——找出高频改动文件、识别核心贡献者、筛选Bug关键词提交、观察月度提交量、统计回滚频率,用提交历史给代码库做"诊断"。在Hacker News引发争议:支持者认为比盲目读文件高效,反对者指出Git数据可能误导、高变更≠高风险。
|
| 7 |
帮普通人「驯服」Agent,这支硅谷初创团队冲上了X全球热搜
硅谷初创公司Creao AI推出CREAO,让用户用自然语言描述需求即可生成可持续运行的Agent系统,无需编程基础。3月30日上线后冲上X全球热搜Top3,用户评价"AI终于走出聊天框"。核心突破:补足Agent"最后一公里",将一次性对话固化为可复用自动化流程。
|
| 1 |
多模态幻觉的病因「高熵节点」找到了!全基准幻觉率下降
最新研究发现,多模态大推理模型的幻觉根源并非"没看见",而是模型在生成because、however、wait等过渡词时处于高熵(高不确定性)状态,此时最易"想偏"。据此提出LEAD解码策略,通过熵感知在解码阶段抑制高熵节点的幻觉生成,全基准幻觉率显著下降。
|
| 2 |
裸辞北大博士带17个Agent,49天造出全球首个AI开放世界!成本仅5000
北大美学博士刘耕裸辞后,率领17个AI Agent协作,49天完成30万行代码,仅花5000元打造出"AI开放世界"Elseland。该项目展示了多Agent协作的惊人生产力:一人即一个"超级军团",被视为AI赋能个人创作者的标志性案例。
|
| 3 |
一行代码,Claude成本直降85%!最强Opus做大脑,Sonnet疯狂搬砖
开发者发现通过"Opus做大脑+Sonnet做执行"的分工模式,一行代码即可将Claude使用成本直降85%:用最强Opus负责规划和决策,用便宜的Sonnet执行具体任务。核心思路:将复杂任务拆解后分配给不同层级模型,兼顾质量与成本。
|
| 4 |
狂揽4万星!换掉OpenClaw太爽了,5美元就能养个AI打工人
Nous Research推出开源Agent神器Hermes Agent,GitHub狂揽4万星,月费5美元即可部署24小时在线AI打工人,无缝接入Telegram、Discord、飞书等平台。核心特色:"会跟着你成长的Agent"——能自主学习攒技能并反哺训练,被视为OpenClaw最强开源对手。
|
| 5 |
Claude Opus 4.6差评如潮!思考深度暴跌67%,AMD总监6852次日志打脸
AMD AI总监在GitHub公开提交问题报告,基于6852次会话日志量化分析,指控Claude Code自2月更新后思考深度暴跌67%,模型从"优先研究"转向"优先编辑",代码质量明显下滑。Anthropic调整默认值引发争议,用户质疑AI公司能否悄悄改动影响质量的参数——"你买下的不是智能,是随时可回收的体验"。
|
| 6 |
刚刚,豆包「成精」了!一夜告别机械感,上亿人手机全量上线
字节跳动Seed团队发布原生全双工语音大模型Seeduplex,已在豆包App全量上线。核心突破:实现"边听边说",能识别用户思考时卡顿并适应,强抗噪能力,彻底消除AI语音机械感。这是业内首个规模化落地的全双工语音模型,上亿用户即时体验。
|
| 7 |
开源屠刀!400美元炼成「代码副脑」,硅谷天价模型成废铁
艾伦研究院推出Open Coding Agents,最低约400美元算力成本即可训练专属编程智能体,SERA-32B在标准编码测试表现优异,成本比传统方法便宜25倍以上。核心方法:采用软验证生成技术大幅降低训练成本,仅需40个GPU日(2块NVIDIA A100),让天价闭源编程模型性价比崩塌。
|
| 1 |
智谱GLM-5.1到阿里龙虾全囊括!OpenClaw研讨会最终议程与大模型论坛嘉宾阵容同步公布
4月21-22日北京站OpenClaw研讨会最终议程公布,涵盖智谱GLM-5.1、阿里龙虾等主流模型,同步揭晓大模型论坛嘉宾阵容。活动聚焦Agent生态发展与模型落地实践,将展示OpenClaw最新应用场景与生态进展。
|
| 2 |
DeepMind创始人最新专访:AGI或5年内实现,规模是工业革命10倍,上一波思想已被「榨干」
谷歌DeepMind CEO Demis Hassabis接受20VC万字访谈,预测AGI将在5年内实现,社会冲击力或达工业革命100倍。指出算力是最大瓶颈,否认模型能力"商品化"论调,称约90%推动现代AI的突破来自Google系和DeepMind。认为当前Scaling Law仍有效,但"上一波思想已被榨干",需新范式突破。
|
| 3 |
林俊旸点赞,干翻字节Seedance 2.0的「欢乐马」模型,阿里造?
代号HappyHorse-1.0的神秘视频生成模型在Artificial Analysis盲测中登顶,击败字节Seedance 2.0。据The Information报道,该模型由阿里淘天集团未来生活实验室开发(负责人张迪),150亿参数支持1080p+音频,是阿里全面对抗字节AI视频赛道的最新动作。字节Seed团队林俊旸点赞相关讨论。
|
| 4 |
暴走30000步!我在85万平米的家博会里,挖出了AI家居的「真心脏」
第57届广州家博会(85万㎡、5100+品牌)实地探访发现:AI已全面渗透家居产业链——从实时监控心率的智能床到鸿蒙底座链接的皮料加工车间,AI家居的"真心脏"不再是单一智能单品,而是以AI操作系统为核心的全场景联动平台,实现从制造端到消费端的全链路智能化。
|
| 5 |
未来医生对话凯文·凯利:人类突破120岁的技术密码是什么?
未来医生CEO王仕锐对话凯文·凯利,探讨医疗AGI如何帮助人类寿命突破120岁。凯利认为医疗AGI"一定会发生",AI正从辅助诊疗进化为重构医疗体系的核心力量。关键信号:从DeepMind蛋白质折叠到医疗Agent密集布局,AI开始介入"生老病死"这一人类最核心命题。
|