readme
1.快速了解语音SDK最简单的调用方法,可以根据需要直接看样例代码(Examples),语音合成(文字转换成语音)请参见ttsdemo,语音转写(语音转换成文字)请参见iatdemo;
2.系统性地了解语音SDK请参见doc文件夹下的《开发手册》和《可设置的参数列表》,如果还想了解识别语法的开发,请参照《语法开发指南》;
3.如果您的开发环境是vs2005或者vs2008,运行时提示“找不到msc.dll”,请在工程属性->调试->工作目录 添加msc.dll文件路径。
如果您使用的是vs2010或者vs2012,可以跳过此步骤;
4.打开对应您环境的sln解决方案,可以在解决方案资源管理器中看到列出的几个样例工程,需要调试某个工程时,请右键单击工程名,选择“设为启动项目”;如果您不喜欢一个解决方案中包含多个工程,可以请进入Examples文件夹,进入需要调试的工程文件夹,打开您的开发环境对应的工程文件(vs2005和vs2008对应vcproj文件,vs2010和vs2012对应vcxproj文件),如果您对各种文件的作用不了解,建议不要进行任何改动;
5.工程中本身都包含WIN32和x64两种平台的配置,在配置管理器中直接选择即可,代码中也会根据选择的平台引用对应的动态库,当然前提是你的vs中安装了对应平台的编译器;
6.bin文件夹是调试路径,里面文件的作用如下:
msc.dll是WIN32平台程序必需的动态库;
msc_x64.dll是x64平台程序必需的动态库;
msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1”改为“output=0”,“output=1”时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;
asr_keywords_utf8.txt是asrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++或UltraEdit等文本编辑软件;
gm_continuous_digit.abnf是asrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;
wav文件夹里面都是事先准备好的录音文件,分别用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result;
当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。
7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。
识别错误率大的原因分析
查看语法文件abnf,发现其英文名为“连续数值型”,故推测其语法仅仅适合于特定的环境。由于SDK中只有一个语法文件,所以我在接下来的过程中使用“语音听写”不使用“语音识别”,经过一系列的程序修改后成功识别出文字。