AI 新闻摘要 2026-04-03

发布于 2026年04月03日

模型与能力

Google 发布 Gemma 4 系列

推出 31B 稠密及 26B MoE 版本,采用 Apache 2.0 许可。31B 性能对标千亿模型,支持 256K 上下文及多模态。llama.cpp 已适配,M2 Ultra 推理达 300 t/s。
> 相关链接:Latent Space 综述


产品与应用落地

Perplexity 推出报税 Agent

发布”Computer for Taxes”,展示垂直场景的代理能力,尝试解决具体税务问题,探索 AI 在专业领域的应用。
> 相关链接:Latent Space 综述


研究与方法

Anthropic 发现 Claude 情绪向量

研究发现模型内部存在情感概念表示,可调节高低,为理解模型内部状态及对齐提供了新视角。
> 相关链接:Latent Space 综述

Karpathy 讨论 LLM 知识库

分享关于模型记忆与检索的技术观点,探讨如何构建更有效的知识基础,优化模型长期记忆能力。
> 相关链接:Latent Space 综述


基础设施与硬件

Axolotl 更新 v0.16

优化 MoE 与 LoRA 的速度及显存占用,提升微调效率,支持更高效的训练流程,降低实验成本。
> 相关链接:Latent Space 综述

线性注意力与向量库优化

社区推出新的线性注意力内核,优化推理速度;向量数据库体验改进,配合文档自动化栈 LiteParse 更新。
> 相关链接:Latent Space 综述


Agent 与工具链

Hermes Agent 框架增长

支持可插拔记忆模块,推动开源模型作为代理引擎的主流化,增强工作流编排与执行能力。
> 相关链接:Latent Space 综述

Cursor 3 动态

顶部推文提及 Cursor 3 更新,IDE 编程助手竞争持续,具体功能细节待进一步确认,关注开发体验提升。
> 相关链接:Latent Space 综述


行业与公司动态

OpenAI 产品与定价更新

ChatGPT 语音模式接入苹果 CarPlay,支持 iOS 26.4+。同时下调 Codex 价格,市场关注竞品是否会跟进。
> 相关链接:Latent Space 综述

美国开源模型未来存疑

Allen Institute 人员变动及 GPT-OSS 状态不明,Google 更新显得尤为重要,生态面临不确定性。
> 相关链接:Latent Space 综述




评论