加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c – 编译器如何优化这段代码

发布时间:2020-12-16 10:04:54 所属栏目:百科 来源:网络整理
导读:考虑以下循环: unsigned long x = 0;for(unsigned long i = 2314543142; i 0; i-- ) x+=i;std::cout x std::endl; 当我正常编译时,执行此循环大约需要6.5秒.但是当我用-O3优化编译时,循环在10 ^ -6秒内执行.这怎么可能?编译器肯定不知道x的封闭表单表达式
考虑以下循环:

unsigned long x = 0;
for(unsigned long i = 2314543142; i > 0; i-- )
    x+=i;
std::cout << x << std::endl;

当我正常编译时,执行此循环大约需要6.5秒.但是当我用-O3优化编译时,循环在10 ^ -6秒内执行.这怎么可能?编译器肯定不知道x的封闭表单表达式如何…

解决方法

如果使用优化进行编译,你不必真正了解程序集的所有内容,以确定编译器在编译时确定x的值.

我稍微修改了你的代码,以便能够使用在线工具Compiler Explorer,更改std :: cout<< x<< std :: endl到extern unsigned long foo;和foo = x;.不是真的有必要,但它使输出更清洁. 用-O2编译:

test():
        movabs  rax,2678554979246887653
        mov     QWORD PTR foo[rip],rax
        ret

用-O0编译:

test():
        push    rbp
        mov     rbp,rsp
        mov     QWORD PTR [rbp-8],0
        mov     DWORD PTR [rbp-16],-1980424154
        mov     DWORD PTR [rbp-12],0
        jmp     .L2
.L3:
        mov     rax,QWORD PTR [rbp-16]
        add     QWORD PTR [rbp-8],rax
        sub     QWORD PTR [rbp-16],1
.L2:
        cmp     QWORD PTR [rbp-16],0
        setne   al
        test    al,al
        jne     .L3
        mov     rax,QWORD PTR [rbp-8]
        mov     QWORD PTR foo[rip],rax
        leave
        ret

另外:由于i> = 0而导致未定义行为的代码的第一个修订版只输出:

test():
.L2:
        jmp     .L2

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读