如何判断文件是文本还是二进制
发布时间:2020-12-14 17:02:56 所属栏目:大数据 来源:网络整理
导读:今天潜水时看到有人询问判别文件内容是否为文本的方法,什么回答都有,主要是: 看后缀:这个比较弱,不要说在*nix下通常都不用后缀,就算是Win下,一方面有很多不知名的后缀;另一方面,后缀是可以随便改的,叫txt的可能是个txt,也可能是个马。 写成文本,
今天潜水时看到有人询问判别文件内容是否为文本的方法,什么回答都有,主要是:
这些答案都算靠谱,也有不靠谱的。居然有人回答:文本终究也是二进制的,所以你没办法判断!NND,这就好像说:Women 本质上就是 Men(人),所以你没法判断 Women 和 Men (男人) 言归正传,除了以上的三种方法外,如果要求不是那么严格,可以用文件的mime type来进行判断,以下的Groovy代码虽然不太直观,但是胜在短小: def isText = { it?.isFile() && it.toURI().toURL().openConnection().contentType?.startsWith('text') }在Java下道理是一样的,先获得URL对象,然后打开连接,获取内容类型……只不过多写几行罢了。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |