使用来自Skype呼叫的MemoryStream,使用SAPI 5.4或MS Speech SDK
我正在尝试使用SAPI 5.4(也是MS Speech Platform SDK v11)对来自Skype呼叫的音频执行连续语音识别.
我可以使用SKYPE4COMLib来获取来自Skype的音频,并通过发出ALTER CALL指令将其推送到TCP端口.您可以将Skype音频定向到文件或TCP套接字.文件工作正常,但我想让它现场运行识别,所以使用TCP套接字. 然后,我构建了一个TCP侦听器来收集传入的数据(音频原始格式),并将字节数组作为MemoryStream传递给SAPI.我已经设置了SAPI,以期望16bit,16khz,mono,PCM格式的原始音频.然而,识别事件永远不会发生?! 我已经尝试将原始音频保存到磁盘,然后将其读入SAPI并且工作正常……因此数据本身很好,Skype正在发送音频.然而,这不能让我做我需要的持续认可. 使用WAV文件或从磁盘或麦克风加载的原始文件,SAPI识别代码可以正常工作.我无法从MemoryStream中获取它. 我发现这篇类似的文章,似乎没有任何建议对我有用,讨论似乎已经变得安静了. Streaming input to System.Speech.Recognition.SpeechRecognitionEngine 有没有人对如何成功让SAPI持续识别C#中作为MemoryStream发送的原始音频的语音有任何指导? 解决方法
当您使用流音频时,我认为您应该使用 recognizer.RecognizeAsync
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- windows – 如何在node.js中监听剪贴板事件?
- windows批量删除当前目录以及子目录的所有空文件夹
- winforms – 将Castle.Windsor与Windows窗体应用程序一起使
- 使用JFlex生成词法分析器 1:安装配置
- backup – 是否需要备份System Volume Information文件夹?
- windows-server-2008 – 按用户和登录类型过滤安全日志
- windows-server-2008 – 是否有提供PowerShell输出的AD工具
- 自动更新 – 服务器2016 – 更新重新启动
- windows-xp – 如何使用像Windows XP一样的阴影在桌面图标上
- windows-server-2008 – 在IIS 7中添加具有不同SSL证书的多