--- layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/nC_dpX5Q_bA.webp --- ## 为什么需要实时语音指令? 我们日常生活中有很多语言, 打字是比语音输入要慢很多的。我们的很多行为。比如,打开灯,打开电视,电脑打开软件,发送消息,询问问题,等等。 这些任何需求只要表述出来,AI就能通过这些分析,然后执行我们相应的动作。 但是所有的这些行为,它都有一个。前提条件为伪代码一样的,语音指令。 > 打开客厅灯。伪代码 “命令” 是 打开,“参数”是客厅灯。这些自然语言,AI已经清晰的理解了我们期望做的事情。
我们不在需要语音唤醒
--- transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/SHE_ZiroE0g.webp --- ## 什么指令可以标记 任何的动作的行为,都可以根据需要去标记为实时语音指令,根据输入的关键字前缀去实现某一个行为。这里列出一些常用的语音动作。 - 打开/关闭 - 记录/停止 - 总结/统计 - 模式切换为(某某模式) - 修改 - 生成/创建/删除 - 搜索 - 语音转文字
播放/暂停,开始,发送,导航到, 提交,保存,分享,下载,上传,等等。
--- transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/3XXSKa4jKaM.webp --- # 如何实现? 基本原理是:实时的录制语音,语音转文字。文字给ai,分析指令,然后执行相应的动作。 需要一个电脑或者手机,实时语音转文字。 如果指令符合预设的语音指令,那么就执行相应的动作。