Perl Inline :: C:需要Inline_Stack_Vars等来避免内存泄漏(bios
发布时间:2020-12-15 21:57:26 所属栏目:大数据 来源:网络整理
导读:我的问题与使用内联C代码有关:是否有必要使用内联堆栈函数(Inline_Stack_Vars)来传入和传出变量,或者在此上下文中是否适合仅修改变量? 为了显示生物序列数据,我需要显示两个对齐字符串之间的差异;例如鉴于这两个字符串: ATCAGAAA--GACATGGGCCAAAGATTAA-CA
我的问题与使用内联C代码有关:是否有必要使用内联堆栈函数(Inline_Stack_Vars)来传入和传出变量,或者在此上下文中是否适合仅修改变量?
为了显示生物序列数据,我需要显示两个对齐字符串之间的差异;例如鉴于这两个字符串: ATCAGAAA--GACATGGGCCAAAGATTAA-CAGTGGCCATTGACAGGA-- --CCCCAACTGACAGGGGGCAAAGATTAA-CAGTGGCCATTG---GGA-- 我想得到这个(第二个字符串中的匹配字符替换为’.’. --.CCC..CT....G...G..........-............---...-- 我有很多序列(数百万的Illumina读数),所以已经转向inline :: c进行字符匹配.以下内联代码似乎工作正常(将第二个参数更改为add_matchchars函数): #!/usr/bin/perl use Inline C; my($seq1,$seq2) = qw/ ATCAGAAA--GACATGGGCCAAAGATTAA-CAGTGGCCATTGACAGGA-- --CCCCAACTGACAGGGGGCAAAGATTAA-CAGTGGCCATTG---GGA-- /; print $seq1,"n"; print $seq2,"n"; add_matchchars($seq1,$seq2); print $seq2,"n"; __END__ __C__ void add_matchchars(char *seq1,char *seq2) { int seq1char; int seq2char; while(seq1char = *seq1++,seq2char = *seq2++) { if (seq1char == seq2char) { *seq2--; if (seq1char != '-') { *seq2 = '.'; } *seq2++; } //printf("%c-%cn",seq1char,seq2char); } // printf("%sn%sn",seq1,seq2); } 但是1)它是否合理有效(是否有更聪明/更好的方式)? 2)它会泄漏内存吗? 解决方法
你不应该依赖标量的char *是可修改的,甚至不是标量的原始缓冲区.相反,返回一个新字符串.
Inline_Stack_Vars宏仅在处理可变数量的参数或多个返回值时有用.这里也不是这样的. 您的代码目前没有内存泄漏(您没有在C函数中分配任何内存),但是有一些问题包括.样式,可能的段错误(正确(seq1char = * seq1,seq2char = * seq2)到while((seq1char = * seq1)&&(seq2char = * seq2))以及Perl字符串可能在字符串中包含NUL的事实. 我认为让你的C函数直接使用标量是一个更好的主意.大致: SV *add_matchchars(SV *seq1_sv,SV *seq2_sv) { STRLEN len1,len2; char *seq1 = SvPVbyte(seq1_sv,len1); char *seq2 = SvPVbyte(seq2_sv,len2); STRLEN min_len = len1 < len2 ? len1 : len2; SV *seq3_sv = newSVpvn(seq2,min_len); char *seq3; STRLEN i; seq3 = SvPVX(seq3_sv); for (i = 0; i < min_len; ++i) { if (seq1[i] == seq2[i]) seq3[i] = '.'; } return seq3_sv; } (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |