- Created a new README.md file detailing CLI commands for synchronization and usage. - Added a section discussing the potential of real-time voice commands in daily life. - Introduced a new slides.md file for a presentation on "超级桌面生活指令" (Super Desktop Life Commands). - Included background and theme settings for the presentation slides.
62 lines
2.0 KiB
Markdown
62 lines
2.0 KiB
Markdown
---
|
||
layout: image-right
|
||
image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/nC_dpX5Q_bA.webp
|
||
---
|
||
## 为什么需要实时语音指令?
|
||
|
||
我们日常生活中有很多语言, 打字是比语音输入要慢很多的。我们的很多行为。比如,打开灯,打开电视,电脑打开软件,发送消息,询问问题,等等。
|
||
|
||
这些任何需求只要表述出来,AI就能通过这些分析,然后执行我们相应的动作。
|
||
|
||
但是所有的这些行为,它都有一个。前提条件为伪代码一样的,语音指令。
|
||
|
||
> 打开客厅灯。伪代码 “命令” 是 打开,“参数”是客厅灯。这些自然语言,AI已经清晰的理解了我们期望做的事情。
|
||
|
||
<div class="mt-4 p3 text-xs bg-gray-100 rounded-md text-red-600">
|
||
我们不在需要语音唤醒
|
||
</div>
|
||
|
||
<my-footer link="https://kevisual.cn/root/relatime-work-slide/" />
|
||
|
||
---
|
||
transition: fade-out
|
||
layout: image-right
|
||
image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/SHE_ZiroE0g.webp
|
||
---
|
||
|
||
## 什么指令可以标记
|
||
|
||
任何的动作的行为,都可以根据需要去标记为实时语音指令,根据输入的关键字前缀去实现某一个行为。这里列出一些常用的语音动作。
|
||
|
||
- 打开/关闭
|
||
- 记录/停止
|
||
- 总结/统计
|
||
- 模式切换为(某某模式)
|
||
- 修改
|
||
- 生成/创建/删除
|
||
- 搜索
|
||
- 语音转文字
|
||
|
||
<div class="p3 text-xs bg-gray-100 rounded-md">
|
||
播放/暂停,开始,发送,导航到, 提交,保存,分享,下载,上传,等等。
|
||
</div>
|
||
|
||
<my-footer link="https://kevisual.cn/root/relatime-work-slide/" />
|
||
|
||
|
||
---
|
||
transition: fade-out
|
||
layout: image-right
|
||
image: https://cdn.jsdelivr.net/gh/slidevjs/slidev-covers@main/static/3XXSKa4jKaM.webp
|
||
---
|
||
|
||
# 如何实现?
|
||
|
||
基本原理是:实时的录制语音,语音转文字。文字给ai,分析指令,然后执行相应的动作。
|
||
|
||
需要一个电脑或者手机,实时语音转文字。
|
||
|
||
如果指令符合预设的语音指令,那么就执行相应的动作。
|
||
|
||
<my-footer link="https://kevisual.cn/root/relatime-work-slide/" />
|