加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

wireshark lua string:byte()错误

发布时间:2020-12-14 21:42:15 所属栏目:大数据 来源:网络整理
导读:我写lua解剖器时遇到字符串问题.我的数据包看起来像: 0000 00 00 00 69 00 10 00 01 00 00 00 ed 00 00 00 0c0010 bf a6 5f ... 调试时,tvb看起来一样 偏移量0x10处的字节是0xbf,但在我的解剖器函数中,我得到了不同的结果,这里是我的代码: local str = buf
我写lua解剖器时遇到字符串问题.我的数据包看起来像:

0000   00 00 00 69 00 10 00 01 00 00 00 ed 00 00 00 0c
0010   bf a6 5f ...

调试时,tvb看起来一样

enter image description here

偏移量0x10处的字节是0xbf,但在我的解剖器函数中,我得到了不同的结果,这里是我的代码:

local str = buf(0x10):string()
local x = string.byte(str,1)

变量x应该是0xbf,但它是0xef,而其他一些偏移量也是0xef:

local str = buf(0x11):string()
local x = string.byte(str,1) -- also get 0xef,should be 0xa6

local str = buf(11):string()
local x = string.byte(str,should be 0xed

似乎大值总是会得到0xef,如0xa6 / 0xbf / 0xed …

小值将是正确的,如0x69 / 0x5f / 0x0c …

我正在使用最新的wireshark 2.0,这是一个错误吗?

解决方法

我对Wireshark的了解并不多,但我很清楚发生了什么.

您正在使用Wireshark的tvbrange:string([encoding])函数.我在Wireshark网站上找到的文档说默认编码是ENC_ASCII. 0x80-0xFF(您报告的问题)范围内的字节不是有效的ASCII.

Wireshark可能正在做的是将这些转换为U FFFD,Unicode的“替换字符”.这是在Unicode字符串中表示未知字符的标准做法.

然后,Wireshark可能在返回Lua时将此字符串编码为UTF-8. U FFFD的UTF-8编码的第一个字节是0xEF,这就是你所看到的.

如果你想从TVB获取原始字节值,可以尝试使用tvbrange:bytes([encoding])函数来获取值.例如

local bytes = buf(0x10):bytes()
local x = bytes:get_index(0) -- maybe 1,I'm not sure if it would be 0 or 1 indexed

也可能有一些编码你可以传递给tvbrange:字符串可以做你想要的,但我找不到任何好的参考.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读