📋 今日要点
• Google Cloud N4A单位成本最低,性能超越Xeon与EPYC
• Intel OpenVINO 2026支持GPT-OSS-20B与int4压缩技术
• LLVM/Clang 22.1发布,新增多架构支持与多项优化
• Mesa PanVK驱动MSAA性能最高提升25.7倍
• AMD HIP默认启用LLVM新卸载驱动,支持统一接口
• Firefox 148上线AI总开关与Sanitizer API防护
• Linux 7.0新增对AMD Zen 6与Intel Nova Lake支持
• KiloClaw实现OpenClaw代理60秒部署至生产环境
Google Cloud N4A性能超越Xeon与EPYC,单位成本最低
Google Cloud N4A(Axion ARM64)、N4(Intel Xeon Emerald Rapids)和N4D(AMD EPYC Turin)均配置16 vCPU、400GB存储,运行Ubuntu 25.10。测试显示,Axion在整数与内存密集型任务中表现优异,多数基准接近或优于Xeon与EPYC。价格方面,N4A为$0.71/小时,N4D为$0.77,N4为$0.82,N4A单位成本最低。
AMD HIP默认启用LLVM新卸载驱动,支持统一接口与静态库
AMD HIP已默认启用LLVM 23新卸载驱动,取代旧有驱动。新驱动支持统一接口、设备代码链接与编译、静态库含设备代码、设备端链接时优化(LTO),兼容Windows与Linux,支持标准构建流程。此前需通过--offload-new-driver参数启用,现默认开启。旧行为可通过--no-offload-new-driver保留,但重定位设备代码和库需重新编译。
LLVM/Clang 22.1正式发布,新增多架构支持与多项改进
LLVM/Clang 22.1正式发布,支持C2y命名循环、更多SSE/AVX/AVX-512内建函数在C++常量表达式中使用。新增对Ampere Computing Ampere1C CPU、Intel Wildcat Lake(-march=wildcatlake)和Nova Lake(-march=novalake,含APX与AVX10.2)的架构支持。ARM64平台新增对Arm C1 Nano/Pro/Premium/Ultra处理器支持。Armv9.7-A架构扩展获得LLVM汇编器与反汇编器支持。RISC-V新增Zvfbfa向量计算支持,Ssctr与Smctr扩展及Qualcomm Xqci/Xqccmp厂商扩展移除实验状态。NVIDIA Olympus调度模型集成。Intel上游化libsycl SYCL运行时库。分布式ThinLTO(DTLTO)开始合并。AMD贡献BFloat16至LLVM SPIR-V目标。Google Native Client(NaCl)支持彻底移除。首个稳定版可从GitHub下载,后续将推出22.1.1补丁版本。
Mesa PanVK驱动实现MSAA性能最高25.7倍提升
Mesa PanVK驱动在针对Arm Mali硬件的Vulkan测试中,实现多采样抗锯齿(MSAA)性能显著提升。新合并至Mesa 26.1的代码通过在渲染流程末尾使用帧着色器执行MSAA解析,优化了性能。实测数据如下:2x MSAA从590 FPS提升至2605 FPS(4.4倍),4x MSAA从347 FPS提升至2570 FPS(7.4倍),8x MSAA从188 FPS提升至2494 FPS(13.2倍),16x MSAA从96.7 FPS提升至2483 FPS(25.7倍)。该改进由Faith Ekstrand主导,核心为采用新的帧缓冲抽象机制。
Linus Torvalds移除WARN_ALL_UNSEEDED_RANDOM选项以消除日志噪声
Linus Torvalds移除Linux内核中的WARN_ALL_UNSEEDED_RANDOM Kconfig选项,以消除因非速率限制报告导致的过度日志输出。该选项原用于标记早期启动阶段未种子化的随机性,但在某些CPU上引发大量重复警告,掩盖关键信息。patch已禁用该选项,开发者建议使用boottime-trace进行调试。同时引入default_gfp()辅助宏并集成至内核代码。
Qualcomm提交QDA驱动补丁,支持DSP加速计算任务
Qualcomm提交QDA驱动补丁系列,用于在Qualcomm SoCs上通过ADSP、CDSP、SDSP、GDSP域的DSP加速计算任务。驱动集成至内核accel子系统,提供标准DRM接口 via /dev/accel/accelN,支持GEM缓冲区管理与DMA-BUF,IOMMU内存隔离,FastRPC协议与RPMsg传输。包含完整IOCTL接口。当前实现共4,665行C代码。用户空间驱动位于Qualcomm FastRPC accel/staging GitHub分支。
Intel OpenVINO 2026支持GPT-OSS-20B等大模型与int4压缩技术
Intel发布OpenVINO 2026.0,支持GPT-OSS-20B、MiniCPM-V-4_5-8B、MiniCPM-o-2.6等大语言模型。新增对Qwen2.5-1B-Instruct、Qwen3-Embedding-0.6B、Qwen-2.5-coder-0.5B等小模型的NPU运行支持。引入int4数据感知权重压缩技术,用于MoE LLM的3D MatMul计算,降低内存与带宽需求。OpenVINO GenAI新增词级时间戳功能,提升语音转录精度。支持VLM流水线,增强Agentic AI框架集成。NPU编译支持提前编译与设备端编译,无需依赖OEM驱动更新。
Firefox 148发布,新增AI总开关与Sanitizer API防护
Firefox 148发布,提供独立关闭AI功能的“AI总开关”,可禁用翻译、PDF替代文本、标签组建议、链接预览要点及侧边栏AI聊天机器人。新增AI“总开关”可禁用所有AI增强功能。该版本还支持Trusted Types API、CSS shape()函数、Sanitizer API,提升WebGPU性能。Linux x86_64版下载地址:ftp.mozilla.org/pub/firefox/releases/148.0/linux-x86_64/en-US/。
Linux 7.0新增对AMD Zen 6与Intel Nova Lake支持
Linux 7.0新增对AMD Zen 6与Intel Nova Lake硬件平台的多项支持。内核默认启用Intel TSX自动模式,优化TSX指令集使用。新增AMD Zen 6性能事件与度量支持,提升perf工具监控能力。Intel DSA 3.0加速器IP、Nova Lake显示与音频驱动、Xeon Diamond Rapids NTB驱动均获支持。Turbostat工具新增L2缓存统计功能。LoongArch、RISC-V、ARM64等架构获得新特性支持。CXL支持AMD Zen 5地址转换功能。OpenRISC FPGA开发板支持增强。Nouveau驱动恢复大页支持,提升NVK性能。Intel Xe图形驱动支持多设备SVM与多队列。Imagination PowerVR驱动新增AM62P支持。AMDGPU修复旧GCN 1.0/1.1硬件兼容性问题。
Kilo推出KiloClaw,60秒部署OpenClaw代理至生产环境
Kilo推出KiloClaw,实现OpenClaw代理60秒内部署至生产环境。基于Fly.io多租户虚拟机架构,提供隔离与安全防护,内置双代理机制防止API密钥泄露。支持500+模型切换,涵盖OpenAI、Google、MiniMax及Qwen等,采用无加价计费模式。具备持续运行能力,支持定时任务、跨平台指令(Slack/Telegram/终端)与持久化记忆存储。配套发布PinchBench开源基准测试工具,评估23项真实场景任务表现,使用Claude 4.5 Opus作为评判模型,可视化成本与性能比。用户可通过Kilo Code平台快速创建实例,无需本地配置。
Smarsh构建AI支持系统Archie,推动59%自服务采纳率
Smarsh基于Salesforce Agentforce 360 Platform开发AI支持系统Archie,用于监管行业客户支持。系统作为集中式智能入口,允许用户以自然语言描述问题并获取上下文相关解决方案。整合清洁匿名内部数据与Salesforce Trust Layer,确保合规性并降低幻觉风险。支持跨系统工作流自动化,无需牺牲安全性。个性化引导后,自服务采纳率达59%。结果包括25%更快问题解决、20%更高成功率、服务团队30%生产力提升。
Google限制OpenClaw用户访问Antigravity平台,称其存在恶意使用
Google限制访问其Antigravity平台的用户,因运行开源AI代理OpenClaw被指存在“恶意使用”行为,导致系统性能下降。受影响用户失去与Gemini令牌关联的Google账户访问权限。Google表示此举符合Terms of Service,非永久性;正努力恢复合规用户。此行动与Anthropic限制第三方访问Claude Code类似。OpenClaw创建者Peter Steinberger宣布计划移除Google支持。Google确认不影响其他Google服务。
单工程师一小时内完成生产级SaaS产品,依托AI治理系统
一名工程师在60分钟内完成生产级SaaS产品开发,依托Treasure Data构建的AI治理系统。系统前置部署平台级访问控制,确保用户仅能操作已有权限资源,禁止暴露PII或API密钥。代码生成采用三阶质量管控:首层由Claude Code驱动的AI评审器,在合并请求阶段执行架构、安全、测试覆盖率检查;第二层为标准CI/CD流水线,包含自动化测试与安全扫描;第三层为必要时的人工审查。产品通过继承平台权限体系与AI Agent Foundry实现跨任务协同,区别于通用工具的直接数据库接入。上线后出现未规划的100+客户自发使用,导致合规与市场策略滞后。非工程团队参与技能开发引发大量无效提交。当前缺失AI成熟度指导框架,尚未提供使用优先级与权限分层建议。
研究人员通过权重嵌入实现LLM推理速度3倍提升,无需推测解码
研究人员通过在模型权重中直接嵌入多token预测机制,实现无需推测解码的3倍推理加速。该方法基于自蒸馏训练,引入特殊<MTP>标记,使模型单次前向传播生成多个token。配合自适应解码策略ConfAdapt,系统在高置信度场景下批量输出,低置信度时保留逐token生成,平衡速度与准确率。实验显示,Llama-3.1-8B模型在数学推理任务上达3倍加速,准确率损失低于3%;Qwen3-4B模型同样实现3倍加速,准确率下降约7%。该技术可适配现有架构,无需修改MoE、窗口注意力等组件,已开源模型与代码,支持vLLM、SGLang等推理框架集成。
AI安全新范式:身份优先的意图控制机制
AI代理在企业中具备自主性,使用API密钥与服务账户如人类身份。传统IAM无法应对动态行为,因代理可在任务中根据上下文或提示发生偏移。Token Security提出身份优先AI安全:为代理分配唯一、生命周期管理的身份,并强制执行意图权限。访问仅在代理当前动作与声明使命及操作上下文一致时授予。例如,代码部署代理仅在批准的管道事件期间获得基础设施访问权。审计日志记录身份与意图,提升合规性与事件响应效率。该模型将治理从管理数千个动作转向监督定义的任务与目的边界。
《守望先锋》移动版《守望先锋:RUSH》公布,专为移动端设计
暴雪娱乐宣布《守望先锋》移动版《守望先锋:RUSH》,为专为iOS与Android设计的俯视角英雄射击游戏。游戏基于《守望先锋》宇宙设定,由暴雪旗下独立团队开发,成员具丰富移动游戏经验。非PC/主机版本移植,后续将在部分国家和地区开启测试。核心玩法聚焦快节奏对战,保留原作英雄技能与角色定位,优化触屏操作体验。
《Panzer Knights: Commander’s Edition》宣布登陆PS5与Xbox Series
Panzer Knights: Commander’s Edition宣布登陆PS5与Xbox Series,2026年发售。物理PS5版确认。捆绑基底游戏与三个额外坦克包:M4-748 Sherman、M26 Pershing、Churchill VII、Valentine XI、Elefant、Panzer VIII Maus。特色包括动漫风格视觉、第三人称坦克战斗、实时战术决策、乘员定制与30+坦克阵容,每辆拥有独特属性与迷彩。包含二战战场战役任务、遭遇战模式与附加内容。
Koei Tecmo将Team NINJA第一开发部转移至Gust,更名为Gust Division 2
Koei Tecmo宣布将于2026年4月1日将Team NINJA第一开发部转移至Gust工作室,更名为Gust Division 2。该团队曾开发DEAD OR ALIVE Xtreme Venus Vacation,并共同开发Atelier Resleriana: Forgotten Alchemy与Polar Night Liberator。Team NINJA第二开发部将拆分为两个新部门。娱乐部、IP业务部、营销部及新设业务部将更名与重组。




