Perl 对 C 的扩展接口

发布时间：2020-12-15 20:53:47 所属栏目：大数据来源：网络整理

导读：XS 语言是一种用来在 Perl 和需要在 Perl 内使用的 C 代码（或者 C 库）之间创建扩展的接口描述文件格式。XS 接口为 C 库链接创建了一个静态链接到 Perl 或者能被 Perl 动态导入的新库。本文的主要目的是介绍如何在 Unix 环境下编写 XS 接口并成功通过编译，

XS 语言是一种用来在 Perl 和需要在 Perl 内使用的 C 代码（或者 C 库）之间创建扩展的接口描述文件格式。XS 接口为 C 库链接创建了一个静态链接到 Perl 或者能被 Perl 动态导入的新库。本文的主要目的是介绍如何在 Unix 环境下编写 XS 接口并成功通过编译，从而实现 Perl 对 C 的扩展，提高代码重用率。

引言

本文面向 Perl 和 C 的开发人员，旨在通过对 Perl 与 C 之间的 XS 扩展接口的介绍，让读者了解到通过 Perl 调用 C 函数的一种方法。为了更好的理解本文，读者需要具备一定的 Perl 和 C 编程经验，并对 Unix 环境下库文件的编译过程和 Makefile 语法有所了解。

什么是 XS 语言

XS 是一个用来在 Perl 和需要在 Perl 内使用的 C 代码（或者 C 库）之间创建扩展的接口描述文件格式。XS 接口为 C 库链接创建了一个静态链接到 Perl 或者能被 Perl 动态导入的新库。XS 接口描述是用 XS 语言写的，是 Perl 扩展接口的核心部分。

当 Perl 代码调用 C 函数时，XS 从 Perl 堆栈中获取参数，将这些参数转化为 C 函数所要求的正确格式，调用相应的 C 函数，并将返回值转化为 Perl 的参数格式，压入 Perl 堆栈供程序读取，或者直接修改 Perl 所提供的变量值。

由于 Perl 提供了比 C 更为自由的变量定义和调用规则，在参数转换过程中，XS 还必须验证参数合法性，抛出异常（或返回 undef 或空值列表），根据参数的数目和类型的不同调用不同的 C 函数，提供面向对象接口等等。

XS 语言的编译器叫做 xsubpp，它为接口创建必要的数据结构和调用关系，xsubpp 根据 typemaps 来确定如何在 Perl 与 C 之间转换函数参数和返回值。标准 Perl 库自带的 typemap 定义了大部分常用的 C 变量类型，但一些特殊的数据结构和类型需要开发人员通过自定义的 typemap 来实现。

.XS 文件

XSUB 解析

XS 接口文件以 .xs 为后缀名，里面定义了 Perl 与 C 之间的接口函数。XSUB 是 XS 接口的基本结构单元，通过 xsubpp 编译后，每个 XSUB 都为相应的 C 函数提供了 Perl 与 C 之间的调用接口。

清单 1 . 一个简单的 .xs 文件

				  
 #include "EXTERN.h"
 #include "perl.h"
 #include "XSUB.h"
       
 MODULE = TEST   PACKAGE = TEST 
 void 
 hello() 
 CODE: 
 printf("Hello,world!/n");

其中前三个 #include 声明：EXTERN.h，perl.h 和 XSUB.h 应该始终出现在每个 XS 文件的开头。其后是其他的头文件 #include 声明。

MODULE= 定义了该 XS 文件所属的 Perl 模块（.pm），同一个 .xs 文件中所有的 MODULE= 都应该保持一致。每个 MODULE= 之后则是对应的 XSUB 定义，直到文件结束或者下一个 MODULE= 语句。

PACKAGE= 定义了该函数所在的 Package，当同一个 .xs 文件需要被划分为多个 Package 时 PACKAGE= 则需要被显式指定。PACKAGE= 应该和 MODULE= 放在一起并紧随其后。

一个最简单的 XSUB 由三部分（section）组成：返回值定义；XSUB 函数名和参数名；以及参数类型。复杂的 XSUB 还包括其他部分，如 CODE:（代码段），IUPUT:（输入值），OUTPUT:（输出值）等等。其中返回值和函数名必须位于每个 XSUB 的开头，分行书写并左对齐顶格，其余部分格式则没有严格要求。

清单 2 .XSUB 格式

				  
 double sin(x)        double                 double 
 double x                sin(x)              sin(x) 
                       double x                double x 
  错误                  错误                  正确

Perl 变量堆栈和参数

Perl 变量堆栈（argument stack）用于存放发送给 XSUB 的参数值及其返回值。XSUB 可以通过宏 ST(x) 访问该堆栈，其中 ST(0) 为该堆栈的起始地址。

清单 3 . 操作 ST(x)

				  
 membername = (char*)SvPV(ST(2),na); 
 ST(0) = newSVpv("Hello World",0);

而宏 SP 代表当前 Perl 堆栈指针，当程序从 XSUB 返回时，处理堆栈上的数据。

清单 4 . 操作 SP

				  
 EXTEND(SP,2);

变量 RETVAL 是一个特殊的 C 变量，它的类型对应于 C 函数的返回值类型。xsubpp 编译器会自动为每个 non-void 返回值类型的函数声明该变量，用于存放被调用的 C 函数的返回值。通常情况下，RETVAL 会作为对应 XSUB 的返回值存放到 Perl 变量堆栈的 ST(0)。

清单 5 .RETVAL 变量

				  
 int 
 is_even(input) 
 int input 
 CODE: 
 RETVAL = (input % 2 == 0); 
 OUTPUT: 
 RETVAL

注意： 当 XSUB 返回值为 void 时，编译器不会为该函数声明 RETVAL 变量；当存在 PPCODE: 关键字时，不能对 RETVAL 变量进行操作，而应该直接操作对应的 Perl 变量堆栈 ST(x)。

XSUB 的一些关键字

OUTPUT: 关键字指定了当 XSUB 结束时应该返回给调用方 Perl 的参数值。在没有 CODE: 段和 PPCODE: 段时，RETVAL 变量会被自动指定为 OUTPUT 变量，否则需要显式指定 OUTPUT 变量。该关键字也能用于指定函数输入参数为 OUTPUT 变量，这在当函数体改变了某个输入参数值并希望将新值返回给调用方 Perl 的情况下十分有用。

清单 6 .C 函数原型

				  
 bool_t gettime(const char *host,time_t *timep);

其函数将指定 host 上的当前系统时间存入指针 timp 对应的地址中，同时返回布尔型状态值。

清单 7 . 对应的 XSUB 函数定义

				  
 bool_t 
 gettime(host,timep) 
	 char *host 
	 time_t &timep 
 OUTPUT: 
	 Timep

CODE: 关键字用于对相应的 C 函数做额外的操作处理，此时 RETVAL 变量仍被声明，但并不作为返回值，除非被 OUTPUT: 关键字显式指定。仍以上面的 C 函数 gettime (host,timep) 为例，如果在 Perl 代码中存在以下的调用：

Perl 代码调用

$status = gettime( "localhost",$timep );

其中 $status 和 $timep 都用于接收 C 函数的返回值，则需要对相应的 C 函数做额外的处理。

清单 9. 对应的 XSUB 函数定义

				  
 bool_t 
 gettime(host,timep) 
	 char *host 
	 time_t timep 
 CODE: 
	 RETVAL = gettime( host,&timep ); 
 OUTPUT: 
	 timep 
	 RETVAL

通过一元运算符 &，当 xsubpp 编译器调用 C 函数 gettime() 时，传给 C 函数的参数 &timep 是指向 time_t 的指针 time_t *，同时将得到的时间值存储在 timep 中返回给 Perl。

PPCODE: 关键字是对 CODE: 的补充，用于直接操作 Perl 变量堆栈。这在当 XSUB 存在多个返回值时十分有用。此时必须在 PPCODE: 中显式的将返回值列表压入堆栈顶。需要注意的是，在同一个 XSUB 中 CODE: 和 PPCODE: 不能同时出现。

PPCODE: 通常直接操作 SP，通过 PUSH*() 宏将返回值列表压入 Perl 堆栈，而不是将其作为返回值传送给 Perl，因此其函数返回值类型一般为 void，用于告诉 xsubpp 编译器不需要声明和创建 VETVAL 变量。

清单 10.PPCODE: 关键字

				  
 void 
 gettime(host) 
	 char *host 
 PREINIT: 
	 time_t  timep; 
	 bool_t  status; 
 PPCODE: 
	 status = gettime( host,&timep ); 
	 EXTEND(SP,2); 
	 PUSHs(sv_2mortal(newSViv(status))); 
	 PUSHs(sv_2mortal(newSViv(timep)));

通过 PUSH() 宏将 C 函数 gettime() 的返回值 status 和 timep 依次压入 Perl 堆栈，有了上面的 XSUB 定义，则在 Perl 代码中可以这样调用上面的 C 函数 gettime()。

Perl 代码调用

($status,$timep) = gettime("localhost");

编译 XS 文件

编译命令 h2xs

使用 h2xs 来编译并生成 XS 扩展接口所必要的系列文件。h2xs 用于根据 C 头文件 .h 生成相应的 Perl扩展，其扩展模块名字由 -n 参数指定，当没有 -n 参数时，则自动使用第一个 .h 头文件的名字，并将其首字母大写作为扩展模块的名字。

表 1. h2xs 常用参数

参数名	说明
-A --omit-autoload	忽略 autoload 机制
-O --overwrite-ok	允许覆盖已存在的扩展文件
-n --name=module_name	指定扩展模块的名字

更为详细和完整的参数列表可参阅相关文档 perldoc-h2xs。

生成的文件

当执行命令 “h2xs -A -n Mytest” 后，系统在当前目录下创建一个子目录 Mytest，并在其下生成一系列文件：MANIFEST，Makefile.PL，Mytest.pm，Mytest.xs，Mytest.t 和 Changes。

MANIFEST

MANIFEST 文件包含了在 Mytest 目录下创建的所有文件的名字。

清单 11 .MANIFEST 文件内容

				  
 Changes 
 Makefile.PL 
 MANIFEST 
 Mytest.xs 
 ppport.h 
 README 
 Mytest.t 
 lib/Mytest.pm 
 mylib/Makefile.PL 
 mylib/test.c 
 mylib/test.h

Changes

Changes 文件记录了扩展接口的创建以及后续的修改动作。

清单 12.Changes 文件内容

				  
 Revision history for Perl extension Mytest. 

 0.01  Tue Jun  2 15:23:11 2009 
 - original version; created by h2xs 1.23 with options 
	 -A -O -n Mytest ./Mytest/mylib/test.h

Makefile.PL

Makefile.PL 文件是一个 Perl 脚本，用于自动生成 Makefile，以创建扩展接口。当执行 “Perl Makefile.PL” 命令后，系统生成相应的 Makfile，然后执行 “make” 会在当前目录下生成 blib 子目录，用于存放将要使用到的共享库文件 (shared library)。

清单 13 . 一个简单的 Makefile.PL

				  
use ExtUtils::MakeMaker; 
 # See lib/ExtUtils/MakeMaker.pm for details of how to influence 
 # the contents of the Makefile that is written. 
 WriteMakefile( 
	 NAME         => 'Mytest',VERSION_FROM => 'Mytest.pm',# finds $VERSION 
	 LIBS         => [''],# e.g.,'-lm'
	 DEFINE       => '','-DHAVE_SOMETHING'
	 INC          => '','-I/usr/include/other'
 );

Mytest.pm

Mytest.pm 文件是一个模块文件，定义了 Perl 如何加载该扩展接口。当在 Perl 代码中出现 “use Mytest;” 时，Perl 会在 @INC 数组中定义的目录列表里搜索 Mytest.pm 并加载。然后 Perl 代码就可以直接调用 Mytest.xs 扩展中定义的 C 函数。

清单 14 .Mytest.pm 框架

				  
 package Mytest; 

 use 5.008008; 

 use strict; 
 use warnings; 

 require Exporter; 
 our @ISA = qw(Exporter); 
 our %EXPORT_TAGS = ( 'all' => [ qw( 
 )]); 

 our $VERSION = '0.01'; 
 require XSLoader; 
 XSLoader::load('Mytest',$VERSION); 

 # Preloaded methods go here. 
 1; 	
 __END__ 
 # Below is the stub of documentation for your module. You better edit it!

Mytest.xs
Mytest.xs 实现了 Perl 扩展接口，通过该接口 Perl 代码可以调用对应 C 文件中定义实现的函数。

Mytest.t

Mytest.t 文件是代码测试脚本，可以通过执行 “make test” 来测试扩展模块的编译是否正确。

清单 15 .Mytest.t 框架

				  
use Test::More tests => 4; 
 BEGIN { use_ok('Mytest') }; 

 # Insert your test code below,the Test::More module is use()ed here so read 
 # its man page ( perldoc Test::More ) for help writing this test script.

编译过程

通常一个 XS 扩展接口的编译过程为以下几步：

清单 16 . 编译步骤

				  
 perl Makefile.PL     
 make                   
 make test 
 make install

首先运行 ”perl Makefile.PL” 在当前目录生成 Makefile；然后运行 ”make” 编译并创建所需的库文件；之后用 ”make test” 测试编译结果是否正确；最后运行 ”make install” 将库文件安装到系统目录，至此整个编译过程结束。

一个 XS 实例

在当前目录创建一个子目录 Mytest，在 Mytest 目录下创建子目录 mylib，并将已写好的 C 头文件和源代码放在 mylib 目录下。

清单 17 . 头文件 test.h

				  
 #define TESTVAL 	 3 
 extern double 	 add(int,long); 
 extern int    max(int,int);

清单 18 . 源文件 test1.c

				  
 #include "./test.h"
 double add(int a,long b) 
 { 
 return (a + b + TESTVAL); 
 }

清单 19 . 源文件 test2.c

				  
 #include "./test.h"
 int max(int a,int b) 
 { 
 return ((a>b)? a:b); 
 }

在 Mytest/mylib 目录下创建 Makefile.PL 文件，以保证在 Mytest 目录运行 ”make” 时会自动调用该 Makefile.PL 并生成相应的 Makefile。

清单 20 .Mytest/mylib 目录下的 Makefile.PL

				  
use ExtUtils::MakeMaker; 
 $Verbose = 1; 
 WriteMakefile( 
 NAME   => 'Mytest::mylib',SKIP   => [qw(all static static_lib dynamic dynamic_lib)],clean  => {'FILES' => 'libmylib$(LIB_EXT)'},); 

 sub MY::top_targets { 
'
 all :: static 
 pure_all :: static 
 static ::  libmylib$(LIB_EXT) 
 libmylib$(LIB_EXT): $(O_FILES) 
 $(AR) cr libmylib$(LIB_EXT) $(O_FILES) 
 $(RANLIB) libmylib$(LIB_EXT) 
'; 
 }

在 MY::top_targets 中，通过 ar 将 mylib 子目录下的 test1.o 和 test2.o 编译为静态库 libmylib.a，并通过 ranlib 更新静态库 libmylib.a 的符号索引表。

注意： $(AR) 和 $(RANLIB) 前面应该是 ‘ Tab ’ 而不是空格，否则 Make 会报 “missing separator” 错误并终止编译。

在 Mytest 的上级目录中执行命令 “h2xs -A -O -n Mytest ./Mytest/mylib/test.h” 以生成扩展接口系列文件。
注意：Perl 会提示覆盖 Mytest 目录，并在 Mytest 中生成上节介绍的系列文件，这也是要将源文件放在 /Mytest/mylib/ 下的原因，以免被自动生成的文件覆盖。

Perl 在 Mytest 下自动生成的 Makefile.PL 并不知道子目录 mylib 的存在，因此需要修改该 Makefile.PL。

清单 21 . 修改 Mytest 目录下的 Makefile.PL

				  
 WriteMakefile( 
	 'NAME'         => 'Mytest','VERSION_FROM' => 'Mytest.pm',# finds $VERSION 
	 'LIBS'         => [''],'-lm'
	 'DEFINE'       => '','-DHAVE_SOMETHING'
	 'INC'          => '','-I/usr/include/other'
	 'MYEXTLIB'     => 'mylib/libmylib$(LIB_EXT)',);

指定了 MYEXTLIB 为 mylib 子目录下的 libmylib.a。

清单 22 . 在 Makefile.PL 文件的最后添加 MY::postamble 函数

				  
 sub MY::postamble { 
'
 $(MYEXTLIB): mylib/Makefile 
 cd mylib && $(MAKE) $(PASSTHRU) 
'; 
 }

在 MY::postamble 中进入 mylib 子目录并运行其下的 Makefile 进行编译，以生成静态库 libmylib.a。

注意： ‘ cd ’ 前面应该是 ‘ Tab ’ 而不是空格，否则 Make 会报 “missing separator” 错误并终止编译。

修改 MANIFEST 文件使其能够正确包含该扩展接口的所有内容。

清单 23 . 修改 MANIFEST 文件
mylib/Makefile.PL mylib/test1.c mylib/test2.c mylib/test.h
修改 Mytest.xs 文件并添加函数定义。

清单 24 . 修改 #include test.h
#include "mylib/test.h"
修改路径为 mylib/test.h 并将尖括号 <> 改为双引号””，以使编译程序能正确找到 mylib 子目录下面的 test.h 头文件。

清单 25 . 添加 add() 和 max() 函数定义
double add(a,b) int a long b int max(a,b) int a int b
提供 Perl 与 C 之间的接口函数，使得 Perl 代码通过 Mytest.xs 中的接口函数可以直接调用相应的 C 函数 add(a,b) 和 max(a,b) 函数。
在 Mytest 目录下运行 ”perl Makefile.PL” 生成 Makefile。

清单 26 . 运行 perl Makefile.PL
% perl Makefile.PL Checking if your kit is complete... Looks good Writing Makefile for Mytest::mylib Writing Makefile for Mytest %
编译器根据 Makefile.PL 自动生成相应的 Makefile 和 mylib 子目录下的 Makefile。

运行 ”make” 生成需要的库文件。

清单 27 . 运行 make

				  
 % make 
 gcc  -c <compile_flag>   test1.c 
 gcc  -c   <compile_flag> test2.c 
 ar cr libmylib.a test1.o test2.o 
 : libmylib.a 
 perl xsubpp -typemap typemap  Mytest.xs > Mytest.xsc && mv Mytest.xsc Mytest.c 
 Please specify prototyping behavior for Mytest.xs (see perlxs manual) 
 gcc  -c  <compile_flag>   Mytest.c 
 rm -f blib/arch/auto/Mytest/Mytest.so 
 gcc <compile_flag> Mytest.o -o blib/arch/auto/Mytest/Mytest.so mylib/libmylib.a 

 chmod 755 blib/arch/auto/Mytest/Mytest.so 
 cp Mytest.bs blib/arch/auto/Mytest/Mytest.bs 
 chmod 644 blib/arch/auto/Mytest/Mytest.bs 
 Manifying blib/man3/Mytest.3pm 
 %

修改 Mytest.t 文件，添加测试代码

清单 28 . 修改 Mytest.t
is( &Mytest::add(1,2),6 ); is( &Mytest::add(3,1),7 ); is( &Mytest::max(1,2 ); is( &Mytest::max(3,3 );
测试代码以不同的参数调用 Mytest::add() 和 Mytest::max() 并同预期结果比较，以确认相应的 C 函数 add() 和 max() 被正确调用。

运行命令 ”make test”，确保所有测试结果正确。

清单 29 . 运行 make test

				  
 % make test 
 PERL_DL_NONLAZY=1 /usr/bin/perl "-MExtUtils::Command::MM" "-e" "test_harness 
 (0,'blib/lib','blib/arch')" *.t 
 Mytest....ok                                                               
 All tests successful. 
 Files=1,Tests=4,0 wallclock secs ( 0.03 cusr +  0.01 csys =  0.04 CPU) 
 %

从结果可以看到测试全部通过，说明相应 C 函数被调用并计算得到了正确的结果。

运行命令 ”make install”，将生成的库文件安装到系统目录中。
至此，我们就能在自己的 Perl 代码中直接调用 test1.c 和 test2.c 里面定义的函数 add() 和 max() 了。

清单 30 .Perl 代码调用

				  
 use Mytest; 
 my $sum = &Mytest::add(1,2); 
 my $max = &Mytest::max(2,3); 
 print “Sum of 1 add 2 is: $sum/n”; 
 print “Max of 2 and 3 is: $max/n”;

结束语

本文介绍了如何在 Unix 上编写和编译 Perl 对 C 的扩展接口 XS，使得 Perl 可以调用 C 代码（或者 C 库）中定义的函数。读者通过本文介绍的详细步骤，可以自行编写 XS 扩展接口，并编译成静态或动态库文件，供 Perl 代码调用。

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!