查看: 92|回复: 0
收起左侧

[IT业界] 国产自主CPU龙芯再获GNU C优化:缺失率暴降72% 性能显著提升

[复制链接]
anyangmo
发表于 3 小时前 | 显示全部楼层 |阅读模式
国产自主CPU龙芯再获GNU C优化:缺失率暴降72% 性能显著提升

快科技4月18日消息,作为国产全自主CPU的代表,龙芯在转向LoongArch架构之后也不断获得了各大软件系统的优化,日前更新的GNU C库glibc版就实现了性能显著提升。

在日前合并的代码中,有一项针对LoongArch架构的特定优化就加入到了Git代码库中,该优化可以默认为LoongArch64启用透明大内存页(Transparent Huge Pages, THP)对齐的加载段。

优化之后,可将ELF可执行文件的加载段与THP边界对齐,能够通过减少快表(TLB)压力并提升指令获取效率,从而在运行大型二进制程序时带来稳定的性能提升。

优化之后的性能变化如何?在龙芯 3A6000 上编译Rust编写的Cargo工具时,测试结果显示指令TLB缺失率暴降了72%,CPU周期减少了4.7%,实际运行时间(wall time)节省了约 4.2%,而在使用 LLVM编译Linux内核时,实际运行时间缩短了约12%。

因此这项补丁带来的默认THP对齐加载段机制,为LoongArch架构带来了显著的性能提升。

此前消息,当前的龙芯已经发展到了龙芯6000系列,其中龙芯3A/B桌面版有4-8核的,服务器版龙芯3C6000系列有16到64核架构,2025年已经有一些典型应用场景落地,包括专用服务器、算力服务器,龙芯公司表示希望今年能够实现批量销售。

值得注意的是,对PC玩家来说,龙芯去年宣布了一款名为龙芯B6600的8核桌面处理器,与3A6000相比,工艺不变,结构优化,升级为LA864,同频性能相比LA664架构的龙芯3A6000大幅提升30%左右

主频预计仍然是2.5GHz,但是会掌握单核睿频技术,一般可以再提升20%,将争取达到3.0GHz。

据悉,龙芯3B6600单核心、多核心性能都可以达到Intel 12/13代酷睿中高端水平,也就是能够媲美i5、i7系列,超过当时市场销售的50%以上桌面CPU。







您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2026-4-18 17:10 , Processed in 0.074299 second(s), 3 queries , Redis On.

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表