模型与能力
Meta 发布 Brain2Qwerty v2:非侵入式脑电实时解码句子
Meta 新版系统能从头皮EEG信号中实时解码语义级句子(不止单字),9名受试者平均词准确率61%,最佳达78%;代码和v1数据集已开源。
> 相关链接:Meta 官宣|代码与数据发布|研究者解读线程
GLM-5.2 成为热门本地大模型:753B 版本可在双 M5 Max 上跑出 16 tok/s
用户用 Unsloth 动态量化(IQ1_S)将 GLM-5.2 753B 压缩至 202GB,在两台 M5 Max(共 256GB 内存)通过 Thunderbolt 5 联机运行,全程不换页,实测 16 token/s、支持 16k 上下文。
> 相关链接:实测视频与细节
Agent 与工具链
Cursor 推出 iOS 版 + 远程云 Agent:手机可随时启停/控制电脑端 Agent
Cursor 正式上线 iOS App,支持在手机上启动常驻云 Agent、远程操控电脑上的 Agent,并集成 PR 差异审查、Live Activities 实时通知等功能。
> 相关链接:官方发布|功能详情
Cognition 推出 Devin Fusion:多模型混合编码架构,成本降 35%
Devin Fusion 把复杂任务拆给不同模型——贵模型做规划,便宜模型干子任务,保持‘Fable 级’代码质量的同时,整体开销降低 35%。
> 相关链接:官方介绍
LlamaIndex 推出 Retrieval Harness:把语义搜索、grep、文件读取打包进一个 Agent 循环
新工具把多种检索方式(向量搜索、正则匹配、目录遍历、文件读取)融合成统一 Agent 流程,比纯 grep 更靠谱,也比大模型硬啃更高效。
> 相关链接:项目介绍|技术讨论
基础设施与硬件
DeepSeek DSpark 上线:单卡投机解码新标杆,Qwen3-4B 接受长度提升 30.9%
DSpark 是 DeepSeek 自研的投机解码引擎,重点优化草稿生成和验证调度;已在 V4-Flash/V4-Pro 预览版部署,比 Eagle3 提速 30.9%,vLLM 社区正快速集成。
> 相关链接:技术详解|vLLM 社区跟进
vLLM 支持四台 DGX Spark 搭建 550B 模型私有服务
vLLM 团队演示用 4 台 DGX Spark(共 32×H200)部署 Nemotron-3-Ultra 550B,对外提供 OpenAI 兼容接口,证明超大模型私有化推理已进入实用阶段。
> 相关链接:部署指南
研究与方法
Snowflake 开源 Arctic RL:Text2SQL 训练从 5 天缩至 36 小时
新框架集成 ZoRRo 加速器,Actor 更新快 6 倍、端到端提速 3.5 倍;在企业 SQL 任务上超过 Gemini 3.1 Pro 和 Claude 4.7,配方全部开源。
> 相关链接:项目发布
W&B 推出 ARIA:内置自动科研 Agent,帮工程师跑实验、写报告、调参数
ARIA 是 W&B 新增的 AI 助手,能自动执行训练任务、分析结果、生成可视化和文档,目标是把 ML 工程师从重复操作里解放出来。
> 相关链接:官方介绍
产品与应用落地
Claude 正式登陆 Azure Foundry:Opus 4.8 / Haiku 4.5 可商用
微软 Azure Foundry 平台现已全面开放 Claude Opus 4.8 和 Haiku 4.5,支持 Azure 身份认证、计费、治理策略、提示缓存和思维链输出。
> 相关链接:Azure 官方公告|Claude 团队确认
Rampart 浏览器端 PII 脱敏模型:14.7MB,客户端即刻红删敏感信息
ndstudio 推出轻量级本地模型 Rampart,仅 14.7MB,可在浏览器内实时识别并脱敏姓名、身份证、手机号等,适合金融、医疗等强监管场景。
> 相关链接:项目主页
行业与公司动态
Arena 估值跃升:上线 8 个月达 1 亿美元年经常性收入(ARR)
AI 模型评测平台 Arena 在推出评估产品 8 个月后实现 1 亿美元 ARR,平台重心转向部署后监控,覆盖任务完成率、幻觉率等 Agent 级指标。
> 相关链接:官方披露|增长数据
cline 推出 $9.99/月模型通行证:一键接入 GLM-5.2、DeepSeek、Kimi 等 6+ 开源模型 API
cline 打包主流中文开源模型(GLM-5.2、Qwen、Kimi、MiniMax 等)API,月付 9.99 美元,免去逐个申请密钥、管理多个账单的麻烦。
> 相关链接:产品页面
政策、治理与安全
多位专家警告:封禁前沿 API 可能适得其反,反而推动开发者转向可控开源权重
The Information、Hugging Face CEO Clement Delangue 等指出,限制 API 访问会加速社区转向本地部署开源模型,因为权重比 API 更难被集中管控。
> 相关链接:The Information 观点|Clement Delangue 评论