跳转至内容
  • 0 赞同
    1 帖子
    3 浏览
    R
    Debian 发布团队成员 Paul Gevers 于 5 月 10 日在 debian-devel-announce 邮件列表发布公告,宣布 Debian 将正式强制要求所有软件包实现可复现构建(reproducible builds)。自公告发布之日起,Debian 的软件包迁移工具已启用检测机制:无法通过可复现性验证的新软件包将被阻止进入测试分支,测试分支中现有软件包若出现可复现性退步同样会被拦截。此举相当于为可复现性水平设置了一个"棘轮",确保整体标准只进不退。 不过,Gioele Barabucci 随即指出,此处的"可复现"特指在 Debian 官方构建环境(buildd)的某个实例中可复现,比可复现构建项目的通常定义更为受限——后者的长期目标是让任意用户在本地系统独立构建出与官方二进制包逐比特完全一致的结果。尽管如此,LWN 与社区普遍认为这仍是可复现构建运动的重要里程碑。目前用户已可通过 debrebuild 工具在本地验证 Debian 官方构建守护进程未向软件包注入恶意内容;长尾问题尚在处理中,此次政策变更的首要目标是防止可复现性状况继续恶化。 LWN.net | Debian 邮件列表 https://lwn.net/Articles/1072314/
  • 0 赞同
    1 帖子
    2 浏览
    R
    据 Phoronix 报道,继 Linux 7.1 开始淘汰 i486 处理器支持后,Linux 7.2 的支持删除范围进一步扩展至缺少时间戳计数器(TSC,Time Stamp Counter)指令的 i586 与 i686 级处理器。受影响的处理器包括 AMD K5 及多款 Cyrix 系列型号;拥有 TSC 的 Intel Pentium 系列则不在本次删除之列。开发者认为,在不支持 TSC 的老旧处理器上维护相关代码路径已成为明显负担,而 TSC 如今可被视为现代 Linux 启动的基础依赖,使内核得以移除大量与非 TSC 相关的 x86 代码路径。AMD K5 于 1996 年 3 月发布,是 AMD 首款完全自主设计的 x86 处理器,采用 RISC 内部架构配合 x86 解码前端,集成 430 万个晶体管,其主要对手为 Intel 奔腾;因上市较晚且性能未达预期,K5 在市场上未获广泛采用。 Phoronix
  • 0 赞同
    1 帖子
    6 浏览
    R
    PS3 开源模拟器 RPCS3 开发团队 5 月 9 日在 X 平台发帖,要求用户停止向其 GitHub 仓库提交 AI 生成的代码拉取请求(PR),并警告今后若有人提交此类代码且未主动申报,将直接封禁账号。帖文写道:"网上有大量资源可以学习调试和编程,而不是生成你自己都看不懂、也根本跑不通的垃圾代码。"当有用户在评论区质疑开发者如何区分 AI 代码与人工代码时,RPCS3 直接回应:“那种垃圾根本不可能是手打出来的。” RPCS3 自 2011 年开发至今,已使 PS3 游戏库中约 70% 的游戏可完整游玩,长期依赖社区贡献者维护。此次抵制并非孤例——今年 2 月,Godot 引擎项目经理 Rémi Verschelde 同样表示,Godot 仓库已被 AI 生成的 PR 大量涌入,严重程度令其考虑专门增聘维护人员处理此类无效提交。随着"氛围编程"(vibe coding)热潮兴起,向开源项目批量提交 AI 生成代码的现象正成为开源社区的新困扰。 Kotaku https://kotaku.com/playstation-3-emulator-devs-politely-ask-that-people-stop-flooding-it-with-ai-code-pull-requests-2000694656
  • 0 赞同
    1 帖子
    15 浏览
    R
    Linux Containers 项目负责人 Stéphane Graber 于 5 月 5 日宣布 Incus 7.0 LTS 正式发布,该版本将获得为期 5 年的长期支持(至 2031 年 6 月),前两年提供 bug 修复、安全补丁及小幅可用性改进,后三年切换为安全修复模式。Incus 是一款现代化的系统容器、应用容器与虚拟机管理器,以 Apache 2.0 协议开源,可从预制镜像或任意 OCI 镜像仓库创建实例。此版本共有 204 名贡献者参与,并修复了由 7asecurity 安全审计发现的 9 个安全漏洞(均评级为中或低危)。主要新特性方面:内置 S3 监听器替换了不再维护的 MinIO,现有存储桶数据将在首次访问时自动迁移;新增 NBD API 与脏位图(dirty bitmap)接口,支持虚拟机的增量备份与恢复;新增 core.shutdown_action 配置项,可在关机时触发集群实例疏散;新增存储池项目访问限制键;集群重均衡时调用实例部署脚本;incus file push/pull 行为对齐 cp 命令语义。 重大变更方面,Incus 7.0 LTS 提升了全线依赖的最低版本要求,包括 Go 1.25、Linux 6.12、QEMU 8.2、LXC 6.0、nftables 1.0 及 dnsmasq 2.90,并彻底移除了 CGroupV1 支持与 xtables(iptables/ebtables)防火墙后端,仅保留 nftables。对于从 Incus 6.0 LTS 直接升级的用户,此次还一并引入了 OCI 应用容器支持、依赖存储卷、网络地址集、Linstor 与 TrueNAS 存储驱动,以及集群组 CPU 基线定义等功能。Incus 6.0 LTS 则进入仅安全维护阶段,包含上述安全修复的 6.0.7 版本正在准备中。 Linux Containers Forum https://discuss.linuxcontainers.org/t/incus-7-0-lts-has-been-released/26641
  • 0 赞同
    1 帖子
    13 浏览
    R
    PHP 项目近日以 51 票赞成、0 票反对、2 票弃权通过 RFC,决定将 PHP 语言及 Zend 引擎的许可证从沿用 26 年的"PHP License 3.01"与"Zend Engine License 2.00"切换至修改版 BSD 许可证(BSD-3-Clause,即 3-clause BSD),新版本分别命名为 PHP License 4 与 Zend Engine License 3,原许可证将正式弃用。此次许可证变更由核心贡献者 Ben Ramsey 于 2025 年 7 月提出,历经六个月公开讨论期,并在投票前取得了原 PHP Group 全部 10 名成员的书面同意及 Perforce Software(Zend 引擎当前持有方)法律顾问的正式授权函。切换至 BSD-3-Clause 后,PHP 软件将首次同时获得开源促进会(OSI)认证与自由软件基金会(FSF)对 GPL 兼容性的认可,从根本上解决了困扰社区近二十年的许可证合规争议——包括 Debian 长期指出的"PHP License 仅适用于 PHP 本身"的模糊性以及与 GPL 的不兼容问题。 此次变更不带来任何向后兼容性破坏:用户权利与贡献者授权范围均保持不变。PHP Group 的自更新条款(原许可证第 5 条)赋予了 PHP Group 无需征得所有历史贡献者同意即可升级许可证的法律依据,因此也无需重新联系数千名代码贡献者。面向外部开发者,OpenAI 文档明确指出:使用 PHP License 3.01 授权的现有 PECL 扩展和第三方项目,可自行选择升级至 BSD-3-Clause,但新项目应直接使用业界通行的 BSD、MIT、Apache 2.0 或 MPL 2.0 等许可证,不建议再使用"PHP License 4"这一名称,以避免授权证扩散。修改将在下一个 PHP 8.x 版本中正式生效。 PHP Wiki | LWN.net
  • 0 赞同
    1 帖子
    17 浏览
    R
    据 PANews 报道,小米 AI 实验室新一代 Kaldi 团队(k2-fsa)正式开源零样本语音克隆 TTS 模型 OmniVoice,支持 646 种语言合成,为目前开源 TTS 模型中语言覆盖范围最广的版本,远超 ElevenLabs 的 32 种与 PlayHT 的 132 种。性能方面,OmniVoice 在 Seed-TTS 中文测试集上的词错率(WER)仅 0.84%;在 24 种语言的多语言基准测试中,语音相似度(SIM-o)达 0.830、WER 为 2.85%,均优于 ElevenLabs v2 等商用系统;在 102 种语言的测试中,可懂度接近甚至超过真实录音,训练数据不足 10 小时的小语种同样可合成。模型仅需 3–10 秒参考音频即可完成零样本音色克隆,亦支持跨语言克隆——上传一段中文录音,即可用同一音色合成日语或其他语言。 架构上,OmniVoice 以 0.8B 参数量的单一双向 Transformer 为核心,基于 Qwen3-0.6B 预训练参数初始化,直接将文本映射至多码本声学 token,省去传统两阶段流水线,推理速度达实时 40 倍(RTF 0.025)。训练数据全部来自 50 个开源数据集,经降噪和质量筛选后共约 58 万小时,低资源语种采用动态上采样策略。除语音克隆外,OmniVoice 还支持文字描述定制音色(如"男,中年,极低音调"或"女,青年,四川话")、带噪参考音频自动降噪、笑声叹气等副语言符号插入,以及中英文多音字与专有名词发音纠正。代码、模型权重和训练数据已以 Apache 2.0 许可在 GitHub(k2-fsa/OmniVoice)和 HuggingFace 同步开源。 PANews | MarsBit https://github.com/k2-fsa/OmniVoice
  • 0 赞同
    1 帖子
    19 浏览
    R
    OpenAI、微软、英伟达、AMD、英特尔及博通的研究团队于 5 月 6 日联合发布论文,正式推出历时两年研发的数据中心网络传输协议 MRC(多路径可靠连接,Multipath Reliable Connection),并通过开放计算项目(OCP)以开放许可证发布规范。MRC 针对大规模 GPU 集群中两大核心痛点而设计:一是拥塞——采用"数据包喷射"(packet spraying)机制,将数据流同时分散至数百条网络路径,避免单链路过载,同时压平集群网络层级,降低整体能耗;二是故障——可在微秒级内检测路径中断并自动切换,使训练任务在网络局部故障时无需中断。此外,MRC 还与 SRv6(IPv6 段路由)协议配合,由发送端直接规划数据路径,大幅减少交换机的路由计算负担。OpenAI 网络负责人 Mark Handley 表示,MRC 让集群网络从"故障放大器"变为弹性基础设施。 MRC 目前已部署于 OpenAI 与微软最大的训练集群,包括甲骨文德克萨斯州 Abilene 站点及微软的 Fairwater 超算,并已参与训练多个 OpenAI 模型。英伟达方面同步宣布,Spectrum-X 以太网平台原生支持 MRC 协议,同时兼容此前的自适应 RDMA 方案,为客户提供传输层选择弹性。OpenAI 工作负载负责人 Greg Steinbrecher 强调,推动 MRC 开源的出发点是消除行业碎片化——当前各家大型公司各自维护私有协议,整体效率低下,统一标准后算力资源才能得到更充分利用。 NVIDIA Blog | The Deep View https://blogs.nvidia.com/blog/spectrum-x-ethernet-mrc/ https://www.thedeepview.com/articles/exclusive-openai-unveils-protocol-to-stretch-compute
  • 0 赞同
    1 帖子
    14 浏览
    R
    据 Ars Technica 报道,一名名为 Andrey Letov 的独立开发者近日发布了"Notepad++ for Mac",该应用托管于 notepad-plus-plus-mac(dot)org,以原版图标和品牌呈现,甚至在页面中收录了原作者 Don Ho 的简介与照片,致使大量用户误以为这是官方版本。据悉,整个移植项目主要借助 AI(Claude Code)完成,仅用约一个月便将原本依赖 Windows Win32 API 的代码库移植为支持 Apple Silicon 与 Intel 双架构的原生 macOS 应用,并附带一个同样由 AI 生成的 AI 聊天插件,且该插件被错误标注为 Don Ho 所作。对此,Ho 公开表示 Letov 未经授权使用了已注册商标,措辞"具有误导性、不当且不尊重",并明确声称 Notepad++ 从未发布过任何 macOS 版本。 目前,Letov 已将项目更名为 Nextpad++,并将其迁移至新域名与新 GitHub 组织,同时从页面中移除了 Don Ho 的个人信息,声称移植初衷是为 Mac 用户填补空白,并非蓄意侵权。此事在开源社区引发广泛讨论——Notepad++ 以 GPLv3 授权开源,任何人均可 fork 代码,但商标权独立于开源协议之外,擅用知名项目名称与品牌发布衍生作品的边界问题由此再度成为焦点。此案也折射出 AI 辅助编程(“氛围编程”)兴起后,开发者借助 AI 快速完成大型移植项目、却在品牌与法律层面疏于审慎的新型风险。 Ars Technica | Neowin
  • 0 赞同
    1 帖子
    15 浏览
    R
    据专注 Signal 动态的独立媒体 AboutSignal 报道,Signal 正在开发桌面应用的独立注册流程(GitHub commit 0fb80a2),未来用户将可以在不依赖安卓或 iOS 手机的情况下,直接在 Windows、macOS 或 Linux 上完成 Signal 账户注册与使用。注册时仍需提供电话号码,但可以是固定电话或功能机号码,这意味着没有智能手机的用户也将能够接入 Signal 的端对端加密通信。此外,另一项代码提交(commit 8a49a24)还为桌面端新增了此前仅限移动端调整的选项,包括链接预览开关、通讯录联系人头像显示,以及密封发件人(Sealed Sender)图标的隐私设置,且这些选项会在桌面端与手机端之间自动同步。 目前上述功能仍处于开发阶段,尚未正式发布,具体上线时间暂未披露。现阶段 Signal Desktop 始终以"关联设备"模式运行,依赖手机端完成初始配置,并需定期打开移动端应用以维持账户活跃状态——独立版本落地后,这一长期被用户诟病的限制将得到根本性改变。对于将 Signal 用于企业内部沟通或团队协作的场景,此次变化也意味着员工可以无需在个人手机上安装应用即可加入 Signal 会议。 AboutSignal https://aboutsignal.com/news/signal-desktop-without-a-mobile-phone-standalone-version-in-development/
  • 0 赞同
    1 帖子
    13 浏览
    R
    NetHack 5.0 于 5 月 2 日正式发布,这是这款传奇 roguelike 游戏自 2015 年以来首次主版本更新。该项目已有 39 年开发历史。5.0 版本跳过 4.x,直接从 3.x 升级至 5.0,以避免与知名社区分支 NetHack 4 混淆。 此版本带来 3100 多项 bug 修复和功能改进,包括代码库升级至 C99 标准、完整的交叉编译支持、用 Lua 替代传统 yacc/lex 编译系统等架构现代化举措。游戏内容方面新增 4 种怪物、多种魔法物品、大量新地牢区域(新增熔岩、洞穴地形)和地表变体设计,提升了探索的多样性。旧存档与亡灵骨骼文件不兼容,所有玩家需重新开始。发布支持 Windows、MS-DOS 和 Amiga 平台的官方二进制版本,展现了对经典硬件的持续支持。 Set Side B | NetHack 官方 https://setsideb.com/nethack-5-0-has-been-released/ https://nethack.org/v500/release.html
  • 0 赞同
    1 帖子
    22 浏览
    R
    GitHub 官方博客宣布将于 6 月 3 日晚 5:30–9:00(太平洋时间)在旧金山总部(275 Brannan St.)举办 OpenClaw: After Hours 社区见面会,限定席位需提前注册并等待确认邮件。活动议程包括 OpenClaw 创始人 Peter Steinberger 的炉边对谈、核心维护者与生态建设者圆桌、闪电演讲及 Happy Hour 交流,现场提供食物饮品。 无法到场的开发者可通过 Twitch.tv/github 观看直播。官方提示名额有限,建议尽早提交申请。OpenClaw 是一个开源工具或框架(具体领域待官方进一步披露),本次活动旨在促进社区交流与生态协作。 GitHub Blog https://github.blog/open-source/register-now-for-openclaw-after-hours-github/
  • 0 赞同
    1 帖子
    21 浏览
    R
    据 LWN 报道,由于近期多家知名开源项目频繁变更许可协议以限制 AI 训练及商业云平台,社区发起了名为 KeepThingsOpen 的新倡议运动。该运动旨在通过签署联合声明,要求项目维护者承诺核心代码库在未来变更协议时必须保持 OSI(开源倡议组织)认可的自由属性。目前,已有超过 150 个活跃的开源项目组和 3000 多名开发者签署了该倡议,以应对日益严重的开源“闭源化”趋势。 自 2024 年以来,受商业竞争与 AI 抓取压力影响,大量开源项目转向 BSL 或 SSPL 等“伪开源”协议。KeepThingsOpen 运动指出,这种做法正在侵蚀开源生态的互操作性基础。与此同时,倡议方正计划建立法律援助基金,帮助小型项目抵御来自大公司的许可协议侵权压力。目前,部分行业观察家担心这一运动可能导致开源社区进一步分裂为“严格理想派”与“商业务实派”两个阵营。 LWN | KeepThingsOpen https://lwn.net/Articles/1070864/ https://keepthingsopen.com/
  • 0 赞同
    1 帖子
    28 浏览
    R
    DeepSeek 4 月 30 日在 GitHub 发布技术报告《Thinking with Visual Primitives》,提出一种新的多模态推理范式——不再依赖纯文字描述或更高分辨率图像,而是在模型的推理轨迹中直接嵌入空间标记(点坐标与边界框)作为"最小思维单元",以此弥合所谓"Reference Gap":自然语言在描述密集空间布局时固有的歧义性,往往导致模型在推理过程中出现逻辑崩塌与幻觉。类比人类用手指逐个数数或在迷宫中用指尖描绘路径,该框架让模型"边指边推理",将抽象语言概念锚定到具体物理坐标。模型底层架构基于 DeepSeek-V4-Flash,将每 4 个视觉 token 的 KV Cache 压缩为单一条目,大幅降低图像 token 消耗;在计数与空间推理基准上,该紧凑规模模型的得分与 GPT-5.4、Claude Sonnet 4.6、Gemini 3 Flash 相当——团队特别注明这些分数仅覆盖与本研究直接相关的维度子集,不代表模型的整体能力。 模型权重将在未来整合进 DeepSeek 基础模型后一并开源,近期计划先公开内部基准与部分冷启动数据;代码以 MIT 许可证授权。这是 DeepSeek 在 V4 发布后一周内首次正式披露多模态方向的技术进展,也与此前社区观察到识图模式(Vision)灰度上线相互印证——尽管二者聚焦层面不同,本报告更偏向"推理时空间锚定机制"这一基础研究课题。 GitHub - deepseek-ai/Thinking-with-Visual-Primitives https://github.com/deepseek-ai/Thinking-with-Visual-Primitives
  • 0 赞同
    1 帖子
    29 浏览
    R
    Fedora Linux 44 于 4 月 28 日正式发布,搭载内核 6.19.14-300.fc44(Linux 7.0 未能赶上此次发布窗口,预计数周后以更新形式推送)。旗舰 Workstation 版内置 GNOME 50,带来可访问性、色彩管理与远程桌面等层面的大量改进;KDE Plasma Desktop 版升级至 Plasma 6.6,引入全新 Plasma Login Manager 与 Plasma Setup,提供更一体化的首次开机体验,同时简化了安装流程。Wine NTSYNC 内核模块通过软件包推荐机制自动启用(无需手动配置),可改善 Wine 与 Steam 运行 Windows 程序(尤其是游戏)的兼容性与性能。Anaconda 安装器改为仅为安装期间实际配置的网卡创建网络配置文件,简化安装后的网络自定义流程;MariaDB 默认版本从 10.11 升至 11.8;Fedora Cloud 的 /boot 分区改用 Btrfs 子卷以改善空间利用率。 桌面版本层面,本次发布同步提供 Atomic Desktops(Silverblue、Kinoite、Cosmic、Budgie、Sway)和 Spins(Cinnamon、Xfce 等)各版。OpenSSL 证书加载时间通过目录哈希支持有所改善,但涉及证书包存储路径变更,升级用户需留意相关文档。Fedora Asahi Remix 44 与本次同期发布(Asahi 项目此前已在进展报告中宣布 M3 系列 Alpha 支持,正式安装器入口随本版本开放)。从 Fedora 43 升级可通过 dnf upgrade --refresh 后执行 dnf system-upgrade 完成,官方称"与普通更新重启基本无异";Linux 7.0 内核将在稳定期(预计 6 月中旬)前推送。 Fedora Magazine | Fedora 44 Release Notes - Desktop https://fedoramagazine.org/announcing-fedora-linux-44/ https://docs.fedoraproject.org/en-US/fedora/latest/release-notes/desktop/
  • 0 赞同
    1 帖子
    33 浏览
    R
    终端模拟器 Ghostty 的创始人 Mitchell Hashimoto(HashiCorp 联合创始人、GitHub 用户 #1299)4 月 28 日发文宣布,Ghostty 项目将迁出 GitHub,原因是该平台近一个月来几乎每天都发生影响其工作的故障。Hashimoto 在文中描述了自己与 GitHub 长达 18 年、几乎每天登录的深厚羁绊,并坦言"写这篇文章让我感到一种不理性的悲伤"——他在 GitHub 上发起了人生中第一个成功的开源项目 Vagrant,彼时的梦想职业也是加入 GitHub。他过去一个月专门记录了日记,为每次 GitHub 故障影响工作的日期打"X",结果几乎每天都有 X。发文当日,GitHub Actions 发生故障导致他约两小时无法进行任何 PR 审查,而这仅是 4 月 27 日更大规模 Elasticsearch 宕机之外的另一次独立故障。他明确表示:“这里不再是严肃工作的场所,如果它每天都能把你挡在门外好几个小时。” 迁移计划正在推进中:Hashimoto 称已与多家供应商(包括商业平台和开源方案)进行讨论,将以渐进方式剥离对 GitHub 的依赖,现有仓库地址将保留为只读镜像。Ghostty 目前在 GitHub 上拥有 27.8k star、约 1700 个公开 issue,是近年增长最快的终端模拟器项目之一,核心功能特性包括基于 Zig 编写、GPU 加速渲染、原生跨平台 UI 与内置 Kitty 图形协议支持。此番迁移的直接触发点是 GitHub 持续不稳定的基础设施,但 Hashimoto 也承认这一决定筹谋已久,并非仅因单次故障一时冲动——他的个人项目仍将留在 GitHub,Ghostty 因对平台基础设施依赖最深、社区影响最大,成为迁移的优先对象。 Mitchell Hashimoto | GitHub - ghostty-org/ghostty https://mitchellh.com/writing/ghostty-leaving-github https://github.com/ghostty-org/ghostty
  • 0 赞同
    1 帖子
    45 浏览
    R
    NVIDIA 于 4 月 28 日发布并开源 Nemotron 3 Nano Omni——一款 30B 总参数 / 3B 激活的混合 MoE 全模态推理模型,统一视觉、音频与语言三类输入(可处理文本、图像、音频、视频、文档、图表与图形界面,输出为文本),原生支持 256K 上下文。模型定位为 Agent 系统中"感知子 Agent"的角色,与同家族的 Nemotron 3 Super(高频执行)、Nemotron 3 Ultra(复杂规划)以及第三方专有模型协同。NVIDIA 称其在六个公开榜单上居于复杂文档智能、视频与音频理解任务首位,吞吐量比相同交互性下的其他开源全模态模型高 9 倍——核心收益来自把视觉与音频编码器内置进同一 MoE 架构、消除 Agent 系统中跨模型反复推理的延迟与上下文割裂。 模型已上线 Hugging Face、OpenRouter、build.nvidia.com 及 25+ 合作平台,权重、训练数据集与训练方法全部开放。三个明确目标场景:电脑使用 Agent(Holotron3 等已基于该模型在 1920×1080 原生分辨率下处理屏幕录制,OSWorld 评测有显著提升)、文档智能(跨视觉结构与文本内容统一推理 PDF、表格、截图等)、音视频理解(将"说了什么/展示了什么/记录了什么"绑定到单一推理流)。已采用方包括 Foxconn、Palantir、H Company、Aible、Eka Care、Pyler、ASI 等;Dell、Docusign、Infosys、Oracle、Zefr 等正在评估中。Nemotron 3 系列(Nano、Super、Ultra)过去一年累计下载量已超 5000 万次,Omni 是该家族首次扩展至全模态与 Agent 域;模型支持从 NVIDIA Jetson、DGX Spark、DGX Station 至数据中心与云端的全栈部署,可作为 NIM 微服务调用。 NVIDIA Blog | NVIDIA Developer Blog | HuggingFace https://blogs.nvidia.com/blog/nemotron-3-nano-omni-multimodal-ai-agents/ https://developer.nvidia.com/blog/nvidia-nemotron-3-nano-omni-powers-multimodal-agent-reasoning-in-a-single-efficient-open-model https://huggingface.co/nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16
  • 0 赞同
    1 帖子
    43 浏览
    R
    阿里 Qwen 团队开源高性能线性注意力内核库 FlashQLA,基于 TileLang 构建,针对 Gated DeltaNet(GDN)Chunked Prefill 的前向与反向算子做了深度融合与优化。在 NVIDIA Hopper 架构(SM90 及以上)多个场景下,相较此前主流的 FLA Triton 内核实现 2-3 倍前向加速、2 倍反向加速,预训练与端侧 Agent 推理场景下加速比尤为明显。基准测试覆盖 Qwen3.5 / Qwen3.6 系列实际使用的 head 配置(h_k,v ∈ {64, 48, 32, 24, 16, 8},对应 TP1 至 TP8),对比基线为 FLA 0.5.0、Triton 3.5.1、FlashInfer 0.6.9 与 TileLang 0.1.8。 技术上 FlashQLA 主打三项优化:一是利用 GDN gate 的指数衰减特性,在 TP、长序列、小 head 数等场景下自动开启卡内 Context Parallel(intra-card CP),提升 GPU SM 利用率;二是对前向与反向做硬件友好的代数重写,在不损失数值精度的前提下显著降低 Tensor Core、CUDA Core 与 SFU 开销;三是采用 TileLang 构建多个融合 warp-specialized 内核,手动实现 warpgroup 特化以重叠数据搬运、Tensor Core 与 CUDA Core 计算——既不像传统实现那样拆分为多个独立 kernel,也不强求把整个流程压进单一 kernel。要求 SM90 及以上、CUDA 12.8、PyTorch 2.8,已采用 MIT 许可证开源。仓库目前 49 star、2 fork。 GitHub - QwenLM/FlashQLA | Qwen Blog https://github.com/QwenLM/FlashQLA https://qwen.ai/blog?id=flashqla
  • 0 赞同
    1 帖子
    32 浏览
    R
    小米 MiMo 团队 4 月 22 日发布并即将开源 MiMo-V2.5 系列模型,覆盖 V2.5(310B 总参数 / 15B 激活)与 V2.5-Pro(1.02T 总参数 / 42B 激活)两档稀疏 MoE 架构,原生支持文本、图像、视频、音频四模态,最长上下文 1M token。模型基于 MiMo-V2-Flash 主干扩展专属视觉编码器(729M 参数 ViT,28 层中 24 层 SWA + 4 层全注意力)与音频编码器(261M 参数,从 MiMo-Audio 权重初始化),保留 Hybrid Attention 5:1 比例与 128 滑动窗口设计——KV 缓存较常规模型缩减近 6 倍。预训练总量约 48T token、采用 FP8 混合精度,Post-train 阶段上下文从 32K 渐进扩展至 1M,并引入 SFT、大规模 Agentic RL 与 Multi-Teacher On-Policy Distillation(MOPD)训练。MiMo-V2.5-Pro 已在 API 平台、AI Studio 等界面全量上线,价格不变,模型 tag 替换为 mimo-v2.5-pro 即可调用。 实测层面,团队公开三项长程任务结果以演示 V2.5-Pro 的"线束感知"能力:在北京大学《编译原理》课设的 SysY 编译器 Rust 实现任务中(人类 PKU CS 学生通常需数周完成),模型用 4.3 小时、672 次工具调用从零完成全部六层(词法/语法分析、AST、Koopa IR、RISC-V 后端、性能优化),通过课程隐藏测试集 233/233 满分;冷启动首次编译即过 137 项(59%),第 512 轮重构回退两项后自主诊断恢复。第二项任务从几句简短 prompt 出发,经 11.5 小时、1,868 次工具调用,端到端生成 8,192 行代码的桌面视频编辑器,含多轨时间线、剪辑、交叉淡入、音频混合与导出。第三项则将 V2.5-Pro 接入 ngspice 仿真闭环(以 Claude Code 作为线束),约 1 小时内为 TSMC 180nm 工艺设计并优化 FVF-LDO 模拟电路,相位裕度等四项指标较初稿提升一个数量级。在 ClawEval 上,V2.5-Pro 以约 70K token/轨迹达到 64% Pass^3,token 消耗较 Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4 同档分别低 40%–60%。 Xiaomi MiMo | HuggingFace | 小米 MiMo API 平台 https://mimo.xiaomi.com/mimo-v2-5-pro/ https://huggingface.co/XiaomiMiMo/MiMo-V2.5 https://platform.xiaomimimo.com/docs/zh-CN/news/v2.5-open-sourced
  • 0 赞同
    1 帖子
    20 浏览
    R
    Phoronix 在 Linux 7.1-rc1 发布当日统计了内核代码规模。尽管 7.1 合并窗口期间大量清理了旧驱动——包括 ISDN、业余无线电(Ham Radio)及其他老旧网络驱动共减少约 13.8 万行代码,还移除了 PCMCIA 驱动、部分 PCI 驱动并开始退出俄罗斯 Baikal CPU 支持——但这些删减远不足以抵消新增代码,Linux 7.1 Git 树总行数已快速逼近 4000 万行。其中 AMD GPU 驱动(AMDGPU + AMDKFD 计算代码及相关基础设施)在 7.1 周期中突破 600 万行,成为主线内核中规模最大的单一开源驱动,这一数字主要来自 Linux 7.0 周期中 AMD 同步提交的多个 GPU 架构寄存器头文件与自动生成的硬件定义文件。 相关背景是:Linux 内核代码总量在 2015 年约为 1900 万行,在近 10 年内翻倍,并于今年 1 月前后正式越过 4000 万行大关;AMD GPU 驱动一家的体量约占整个内核的 15%,Phoronix 的逐版本追踪数据显示其规模在每个内核周期都以百万量级持续扩张。Intel 486 CPU 支持的退出在 7.1 中仅完成了配置文件删除,代码清理将延续至后续版本,对总行数影响有限。 Phoronix https://www.phoronix.com/news/Linux-Kernel-Nearly-40M
  • 0 赞同
    1 帖子
    43 浏览
    R
    Git 2.54 于 4 月 20 日正式发布,来自 137 名贡献者(66 名首次参与)的提交合并进入这一版本,同时覆盖 2.53 的新特性。最大亮点是新增实验性命令 git history,提供 reword 与 split 两个子命令:git history reword <commit> 可直接在编辑器中修改任意历史提交的提交信息,并自动更新所有下游分支,全程不触碰工作区或暂存区,甚至支持裸仓库;git history split <commit> 则以类似 git add -p 的交互界面将一个提交拆分成两个,自动重写后代分支——该命令底层基于 git replay 的核心库,有意不支持含 merge commit 的历史、也不允许产生冲突,定位为"精准、非交互式历史改写"而非 rebase -i 的替代。另一重要特性是配置文件定义钩子:不再要求把脚本放入 .git/hooks/ 目录,可直接在 ~/.gitconfig 或系统级配置中以 [hook "name"] event = pre-commit 的形式声明钩子,多个钩子可绑定同一事件并按顺序执行,支持通过 hook.<n>.enabled = false 单独禁用,git hook list 可查看来源。 功能更新层面,git maintenance run 的默认维护策略由 gc 切换为 2.52 引入的 geometric——后者通过增量合并满足几何级数关系的 packfile,避免昂贵的全量 GC,同时保持 commit-graph 与 reflog 最新;git replay 新增原子引用更新(不再向 stdout 打印 update-ref 命令)、--revert 模式与根提交支持;git log -L 路由经标准 diff 管线,首次与 -S、-G、--word-diff、--color-moved 兼容;HTTP 传输新增 429 重试机制,支持 Retry-After 头与 http.retryAfter、http.maxRetries、http.maxRetryTime 配置;git rebase 新增 --trailer 选项可批量为所有被 rebase 的提交附加 trailer;git blame 支持 --diff-algorithm 参数;alias 命令名限制从 ASCII 字母数字放开至任意字符(通过 subsection 语法),使 “状態” 或 “hämta” 这样的本地语言别名成为可能;此外 MIDX 增量索引新增 compaction 支持,为长期运行的大型仓库提供更可持续的多层压缩。 GitHub Blog https://github.blog/open-source/git/highlights-from-git-2-54/