JavaScript如何实现语音识别_JavaScript中Web Speech API怎样调用

16次阅读

javaScript语音识别依赖Web Speech API，主要通过SpeechRecognition接口实现，需检测兼容性、获取麦克风权限，并配置continuous、interimResults等参数以支持连续实时识别。

javascript 实现语音识别主要依靠浏览器原生支持的 Web Speech API，其中关键接口是 SpeechRecognition（目前在 chrome、edge 等基于 Chromium 的浏览器中稳定可用，firefox 支持有限，safari 尚未支持）。它允许网页通过麦克风实时捕获语音并转换为文本。

确认浏览器兼容性与权限获取

Web Speech API 不是所有浏览器都默认启用，调用前需检查是否存在，并引导用户授予权限：

检测 window.SpeechRecognition 或 window.webkitSpeechRecognition 是否存在（Chrome 使用带前缀的版本）
首次调用 recognition.start() 时，浏览器会自动弹出麦克风权限请求；若用户拒绝或未授权，需提示手动开启（如进入设置 → 网站设置 → 麦克风）
可在页面加载后尝试一次静默检测，避免用户点击后才报错

初始化并配置 SpeechRecognition 实例

创建识别器后，可设置识别行为，提升实用性：

使用 new (SpeechRecognition || webkitSpeechRecognition)() 创建实例
设置 recognition.continuous = true 支持连续识别（非说完即停）
设 recognition.interimResults = true 可获取中间结果（带下划线的暂定文本），适合实时反馈
指定语言：如 recognition.lang = 'zh-CN'（中文）或 'en-US'（英文）
限制单次识别时长：用 recognition.maxAlternatives = 1 减少冗余结果

监听关键事件并处理识别结果

语音识别是异步过程，依赖事件驱动。核心事件有：

立即学习“Java免费学习笔记（深入）”；

onstart：麦克风已开启，开始收音
onresult：收到识别结果。Event.results 是 SpeechRecognitionResultList，每项含多个 SpeechRecognitionAlternative；取 results[results.Length - 1][0].transcript 获取最新文本
onend：识别结束（可能因超时、错误或用户停止）。常在此处自动重启：recognition.start()，实现“一直听”效果
onError：捕获错误，如 error.error === 'no-speech'（没检测到语音）、'aborted'（被中断）或 'not-allowed'（权限被拒）

基础调用示例（可直接运行）

以下代码片段可粘贴进 html 文件，在 Chrome 中测试：

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition; if (!SpeechRecognition) {   console.error('当前浏览器不支持语音识别'); } else {   const recognition = new SpeechRecognition();   recognition.lang = 'zh-CN';   recognition.interimResults = true;   recognition.continuous = true; recognition.onresult = (event) => { const transcript = Array.from(event.results) .map(result => result[0].transcript) .join(''); console.log('识别结果：', transcript); };
recognition.onend = () => recognition.start(); // 自动重连 recognition.onerror = (e) => console.warn('识别出错：', e.error);
// 页面加载后等待用户触发，例如点击按钮再 start() document.getElementById('start-btn').onclick = () => recognition.start(); }

发表于：数据库

2025-12-30

复制链接

css 颜色切换不自然怎么办_给 background color 添加过渡

SQL 数据库连接耗尽的原因

SQL按周聚合数据怎么实现_SQL按周分组统计方法详解

MongoDB 嵌套 _id 字段的模糊匹配与删除操作详解

比特币交易所有哪些?如何选择?五大2026年最适合比特币新手交易的交易所

JavaScript如何实现语音识别_JavaScript中Web Speech API怎样调用

确认浏览器兼容性与权限获取

初始化并配置 SpeechRecognition 实例

监听关键事件并处理识别结果

基础调用示例（可直接运行）

PHP如何区分线程安全与非安全_PHP区分线程安全与非安全法【辨析】

mysql存储引擎是什么_mysql InnoDB与MyISAM区别

Golang中nil函数变量的调用行为_引发Panic

Golang如何在命令行程序中处理错误_Golang CLI错误输出方法

HTML5怎么实现网页跳转有哪些基本方式_新手必学HTML5跳转基础用法【教程】

MAUI Essentials是什么 MAUI Essentials功能详解

Android animation scale pivot XML缩放动画中心点设置

PHP 中实现学生成绩降序排序的完整教程

composer怎么编写自定义插件_composer插件开发入门【高级】

如何正确处理 Turso 数据库中异步插入操作的返回值与日志输出问题