c – 编译器如何优化这段代码
发布时间:2020-12-16 10:04:54 所属栏目:百科 来源:网络整理
导读:考虑以下循环: unsigned long x = 0;for(unsigned long i = 2314543142; i 0; i-- ) x+=i;std::cout x std::endl; 当我正常编译时,执行此循环大约需要6.5秒.但是当我用-O3优化编译时,循环在10 ^ -6秒内执行.这怎么可能?编译器肯定不知道x的封闭表单表达式
考虑以下循环:
unsigned long x = 0; for(unsigned long i = 2314543142; i > 0; i-- ) x+=i; std::cout << x << std::endl; 当我正常编译时,执行此循环大约需要6.5秒.但是当我用-O3优化编译时,循环在10 ^ -6秒内执行.这怎么可能?编译器肯定不知道x的封闭表单表达式如何… 解决方法
如果使用优化进行编译,你不必真正了解程序集的所有内容,以确定编译器在编译时确定x的值.
我稍微修改了你的代码,以便能够使用在线工具Compiler Explorer,更改std :: cout<< x<< std :: endl到extern unsigned long foo;和foo = x;.不是真的有必要,但它使输出更清洁. 用-O2编译: test(): movabs rax,2678554979246887653 mov QWORD PTR foo[rip],rax ret 用-O0编译: test(): push rbp mov rbp,rsp mov QWORD PTR [rbp-8],0 mov DWORD PTR [rbp-16],-1980424154 mov DWORD PTR [rbp-12],0 jmp .L2 .L3: mov rax,QWORD PTR [rbp-16] add QWORD PTR [rbp-8],rax sub QWORD PTR [rbp-16],1 .L2: cmp QWORD PTR [rbp-16],0 setne al test al,al jne .L3 mov rax,QWORD PTR [rbp-8] mov QWORD PTR foo[rip],rax leave ret 另外:由于i> = 0而导致未定义行为的代码的第一个修订版只输出: test(): .L2: jmp .L2
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |