📋 今日要点
• Taalas发布Llama 3.1 8B推理专用ASIC芯片
• NTransformer实现Llama 3.1 70B单RTX 3090推理
• Stripe发布Minions全自主编码代理每周生成千余PR
• AOMedia启动OAC项目替代Opus音频编码
• Linux 7.0内核增强Microsoft Hyper-V虚拟化支持
• Valve修复老旧AMD GPU在Linux下启动问题
• NASA将Artemis II火箭回撤VAB进行氦气流修复
• Arkanix Stealer恶意软件两个月后停止运营
AOMedia启动OAC项目,旨在替代Opus音频编码
AOMedia宣布启动开放音频编码器(OAC)项目,基于Opus代码库开发。项目采用liboac作为参考实现,符号前缀重命名为oaci_。OAC支持原始比特流的编码与解码,包含测试工具,但调试数据不可用于文件分发。代码已公开于GitHub,仓库地址为AOMediaCodec/oac。项目目前处于早期阶段。
Valve开发者修复老旧AMD GPU在Linux下的启动问题
Valve开发者Timur Kristóf发现并修复了搭载AMD Radeon R9 M380 GPU的设备在Linux系统中因AMDGPU驱动导致的启动失败问题。问题源于显示时钟电压依赖未正确实现,引发AtomBIOS错误和UVD模块无响应。修复方案为禁用内存时钟动态电源管理(MCLK DPM),强制使用最高内存时钟频率。相关补丁已提交至GitLab,涵盖Sea Islands架构GPU的兼容性改进。
Linux 7.0内核增强Microsoft Hyper-V虚拟化支持
Linux 7.0内核为Microsoft Hyper-V引入多项改进。新增集成调度器(MSHV),支持L1VH分区自主调度vCPU,优化物理核心资源分配。内存管理与hypervisor状态处理得到修复,新增MSHV分区管理能力及标志位。PREEMPT_RT实时内核补丁提升实时性能,DebugFS接口开放更多MSHV统计信息。相关代码已合并至主线内核。
Arkanix Stealer恶意软件被发现,两个月后停止运营
Arkanix Stealer于2025年10月在暗网论坛出现,为短期运行的信息窃取型恶意软件。其控制面板与Discord服务器用于用户通信。该恶意软件支持22个浏览器,可窃取cookies、密码、浏览历史、加密货币钱包数据及OAuth2令牌。附加模块包括Chrome抓取器、Exodus/Atomic钱包修补器、屏幕截图工具、HVNC、FileZilla与Steam盗取器。C++版本支持RDP凭证窃取、反沙箱检测、WinAPI屏幕捕获及Epic Games/Battle.net平台集成。使用ChromElevator绕过Google ABE。Kaspersky识别出LLM辅助开发特征。项目于发布两个月后终止。
NASA将Artemis II火箭回撤至VAB进行氦气流修复
NASA决定将Artemis II SLS火箭从发射复合体39B回撤至航天器装配大楼(VAB)。原因为上层级氦气流量中断,检测于例行再加压过程中发现,无法在发射台解决。维修需借助VAB工作平台。原定3月发射窗口失效。工程师正排查检查阀、脐带接口或滤网故障可能。飞行终止系统电池也将更换。周四燃料测试未发现显著氢泄漏。下一次发射机会始于4月1日。
Taalas发布Llama 3.1 8B推理专用ASIC芯片
Taalas推出专用于Llama 3.1 8B(3/6 bit量化)推理的ASIC芯片,实现17,000 tokens/秒吞吐量。芯片采用固定功能架构,模型权重直接蚀刻于硅片,无需外部存储访问。数据通过32层物理晶体管顺序流动,跳过VRAM,降低延迟。自研‘魔力乘法器’以单个晶体管完成4-bit乘法运算。片上SRAM负责KV缓存与LoRA适配器。芯片开发周期仅两个月,基于可复用基础网格,仅顶层定制。
Stripe发布Minions:全自主编码代理每周生成千余PR
Stripe推出Minions,一种一次性、端到端自主编码代理。任务由Slack发起,经Devbox环境执行,CI验证后生成符合规范的Pull Request,全程无需人工干预。基于Block的goose框架,集成内部工具链,使用MCP协议调用400多个工具获取上下文。支持自动修复lint与测试问题。本地测试5秒内完成,CI最多运行两次,失败后反馈至代理迭代。系统设计确保代理遵循Stripe开发规范,与人类工程师共用同一套工具体系。
NTransformer实现Llama 3.1 70B在单RTX 3090上推理
NTransformer实现Llama 3.1 70B模型在单块RTX 3090(24GB VRAM)上的推理。通过PCIe流式传输模型层至GPU内存,结合NVMe直接I/O绕过CPU,构建三层次自适应缓存:VRAM驻留层(零I/O)、Pinned RAM(H2D仅传)、NVMe/mmap回退。Q4_K_M量化后,Tiered+层跳过模式达0.5 tok/s,较mmap基线提升83倍。关键优化包括双缓冲SLEP流水线、基于余弦相似度的层跳过(20/80层跳过阈值0.98)、自推测解码。需Linux系统、CUDA 13.1、gcc-14、RTX 3090及以上显卡及专用NVMe SSD。系统配置脚本修改GRUB参数、补丁NVIDIA驱动与CUDA头文件、绑定NVMe至VFIO,禁止用于启动盘。支持GGUF格式多种量化,无外部依赖。




