c – 如何从mp3文件中提取音频数据?
我需要创建一个mp3文件的元数据独立哈希(即,在重复之后可以计算相同的哈希).如何将音频数据仅提取到内存中,而不是通过解压缩器实际运行?
MAD似乎是一个很好的起点 – http://www.underbit.com/products/mad/,但似乎没有明显暴露这样做的功能. 任何指针赞赏! 解决方法
如果不对其进行解压缩,则无法提取音频数据 – 它已被压缩!但是,如果您只想要原始压缩流,请继续阅读! 典型的mp3音频文件将分为几个部分: 可能是metatag:大多数mp3音频文件都有一个id3标签.请注意,某些用户可能会使用不同的标记格式标记其mp3文件,例如APE,因此您也需要考虑这一点. 可能的垃圾:一些mp3音频文件已被标记,重新标记和转换,因此metatag标头可能无法为第一个音频帧提供准确的偏移,因为之前标签的残留可能会留下. foobar2000有一个选项来解决这个问题. 可能的XING / LAME标签:这些标签包含在mp3音频帧中,但它们不包含实际音频. madplay有代码向您展示如何读取和解析这些帧. XING / LAME标头可能有帧数,因此值得解析这些标头.同样,如果文件已经通过许多不同的标记器和编辑器,则可能存在几个格式错误,无效的音频帧. MP3音频帧:实际的压缩流,分为“帧”.每帧将以同步位模式0xFFE开始. 可能的元标记:在文件末尾找到更多的元标记并不罕见. id3v1,APE,歌词都可以在这里找到. 要查找音频帧偏移量,您需要解析任何元标记头,然后开始寻找同步位模式.您不能只从文件的开头开始查找同步模式,因为并非所有标记都正确支持unsynchronization,因此元标记本身可能包含0xFFE模式. 一旦你有第一个音频帧的偏移量,你应该查看文件的末尾并计算有多少非音频数据,以便你知道何时停止解析音频.一旦你有音频数据开头的偏移量和音频数据末尾的偏移量,你就可以通过你的散列/校验和函数传递音频数据了! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |