--- layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/nC_dpX5Q_bA.webp --- ## 为什么需要实时语音指令？我们日常生活中有很多语言, 打字是比语音输入要慢很多的。我们的很多行为。比如，打开灯，打开电视，电脑打开软件，发送消息，询问问题，等等。这些任何需求只要表述出来，AI就能通过这些分析，然后执行我们相应的动作。但是所有的这些行为，它都有一个。前提条件为伪代码一样的，语音指令。 > 打开客厅灯。伪代码 “命令” 是打开，“参数”是客厅灯。这些自然语言，AI已经清晰的理解了我们期望做的事情。

我们不在需要语音唤醒

--- transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/SHE_ZiroE0g.webp --- ## 什么指令可以标记任何的动作的行为，都可以根据需要去标记为实时语音指令，根据输入的关键字前缀去实现某一个行为。这里列出一些常用的语音动作。 - 打开/关闭 - 记录/停止 - 总结/统计 - 模式切换为(某某模式) - 修改 - 生成/创建/删除 - 搜索 - 语音转文字

播放/暂停，开始，发送，导航到，提交，保存，分享，下载，上传，等等。

--- transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/3XXSKa4jKaM.webp --- # 如何实现？基本原理是：实时的录制语音，语音转文字。文字给ai，分析指令，然后执行相应的动作。需要一个电脑或者手机，实时语音转文字。如果指令符合预设的语音指令，那么就执行相应的动作。