- Created a new README.md file detailing CLI commands for synchronization and usage. - Added a section discussing the potential of real-time voice commands in daily life. - Introduced a new slides.md file for a presentation on "超级桌面生活指令" (Super Desktop Life Commands). - Included background and theme settings for the presentation slides.
2.0 KiB
2.0 KiB
layout, image
| layout | image |
|---|---|
| image-right | https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/nC_dpX5Q_bA.webp |
为什么需要实时语音指令?
我们日常生活中有很多语言, 打字是比语音输入要慢很多的。我们的很多行为。比如,打开灯,打开电视,电脑打开软件,发送消息,询问问题,等等。
这些任何需求只要表述出来,AI就能通过这些分析,然后执行我们相应的动作。
但是所有的这些行为,它都有一个。前提条件为伪代码一样的,语音指令。
打开客厅灯。伪代码 “命令” 是 打开,“参数”是客厅灯。这些自然语言,AI已经清晰的理解了我们期望做的事情。
我们不在需要语音唤醒
transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/SHE_ZiroE0g.webp
什么指令可以标记
任何的动作的行为,都可以根据需要去标记为实时语音指令,根据输入的关键字前缀去实现某一个行为。这里列出一些常用的语音动作。
- 打开/关闭
- 记录/停止
- 总结/统计
- 模式切换为(某某模式)
- 修改
- 生成/创建/删除
- 搜索
- 语音转文字
播放/暂停,开始,发送,导航到, 提交,保存,分享,下载,上传,等等。
transition: fade-out layout: image-right image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/3XXSKa4jKaM.webp
如何实现?
基本原理是:实时的录制语音,语音转文字。文字给ai,分析指令,然后执行相应的动作。
需要一个电脑或者手机,实时语音转文字。
如果指令符合预设的语音指令,那么就执行相应的动作。