使用自动生成的C代码对大型C dll进行性能损失
我正在开发一个需要调用一系列优化求解器的软件.每个解算器都是一个自动生成的C代码,有数千行代码.我使用了200个这样的求解器,只是要解决的优化问题的大小不同.
总而言之,这些自动生成的解算器得到了大约180MB的C代码,我在Visual Studio 2008中使用extern“C”{/ * 200求解器’标头* /}语法编译为C.编译所有这非常慢(使用“最大速度/ O2”优化标志,大约需要8小时).出于这个原因,我认为将解算器编译成单个DLL是个好主意,然后我可以从一个单独的软件调用它(这将有一个合理的编译时间,并允许我抽象出所有这些extern“ C“来自更高级别代码的东西”.编译后的DLL大约是37MB. 问题是当使用DLL执行这些解算器之一时,执行需要大约30ms.如果我只将那个单个解算器编译成DLL,并从同一个程序调用它,则执行速度大约快100倍(<1ms).为什么是这样?我可以绕过吗? DLL如下所示.每个求解器使用相同的结构(即它们具有相同的成员变量),但它们具有不同的名称,因此所有类型转换. extern "C"{ #include "../Generated/include/optim_001.h" #include "../Generated/include/optim_002.h" /*etc.*/ #include "../Generated/include/optim_200.h" } namespace InterceptionTrajectorySolver { __declspec(dllexport) InterceptionTrajectoryExitFlag SolveIntercept(unsigned numSteps,InputParams params,double* optimSoln,OutputInfo* infoOut) { int exitFlag; switch(numSteps) { case 1: exitFlag = optim_001_solve((optim_001_params*) ¶ms,(optim_001_output*) optimSoln,(optim_001_info*) &infoOut); break; case 2: exitFlag = optim_002_solve((optim_002_params*) ¶ms,(optim_002_output*) optimSoln,(optim_002_info*) &infoOut); break; /* ... etc. ... */ case 200: exitFlag = optim_200_solve((optim_200_params*) ¶ms,(optim_200_output*) optimSoln,(optim_200_info*) &infoOut); break; } return exitFlag; }; }; 解决方法
我不知道您的代码是否内联到示例中的每个案例部分.如果你的函数是内联函数,并且你把它全部放在一个函数中,那么它会慢很多,因为代码是在虚拟内存中布局的,这需要在执行代码时跳转到CPU.如果不是全部内联,那么这些建议可能会有所帮助.
你的解决方案可能会被…改进 一个) 要么… B)将每个解决方案构建为单独的.lib文件.然后,每个解决方案将非常快速地编译,然后您可以将它们全部链接在一起.构建一个指向所有函数的函数指针数组,并通过查找来调用它. result = SolveInterceptWhichStep; 将所有libs组合成一个大型lib不应该花费8个小时.如果花了那么长时间,你就会做一些非常错误的事情. 和… 尝试将代码放入不同的实际.cpp文件中.也许特定的编译器如果它们都在不同的单元等中会做得更好……然后一旦编译了每个单元,如果你没有改变任何东西,它将保持编译. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |