关于语音识别的设想和发展已经将近半个世纪,而针对主流的大词汇量识别系统的积累也终于日趋完善。尽管语音识别是一门涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等的复杂技术。但如果要简单地介绍给用户听的话,那就是:它已经可以“工作”了。
“云计算”和“大数法则”似乎是这个时代大家最易理解的算法模型,而实际上语音识别做到的,远比你理解的多得多。首先语音识别在云端完成可以大大减低本地硬件的门槛,同时智能的“云”将不再只是听懂你的话,而是逐渐理解你语义的“可成长”的技术。2012年3月22日科大讯飞在国际会议中心进行的新一代“语音云”平台的发布,让用户和开发者对语音识别的期待与热情被提到了最高。然而语音“被识别”,仅仅是语音识别的做到的第一步,之后的“语义理解”是否需要开发者介入大量时间来研发和完善?技术已经准备完善,系统可以不断学习,那开发者和应用何在?什么样的语音应用才是用户的最大需求?常见应用加上语音识别以后,有产生什么伟大创造?语音识别解放了双手,甚至眼睛,这对应用使用情景的扩展会有哪些帮助?