JavaScript如何实现语音识别_JavaScript中Web Speech API怎样调用

16次阅读

javaScript语音识别依赖Web Speech API,主要通过SpeechRecognition接口实现,需检测兼容性、获取麦克风权限,并配置continuous、interimResults等参数以支持连续实时识别。

JavaScript如何实现语音识别_JavaScript中Web Speech API怎样调用

javascript 实现语音识别主要依靠浏览器原生支持的 Web Speech API,其中关键接口是 SpeechRecognition(目前在 chromeedge 等基于 Chromium 的浏览器中稳定可用,firefox 支持有限,safari 尚未支持)。它允许网页通过麦克风实时捕获语音并转换为文本。

确认浏览器兼容性与权限获取

Web Speech API 不是所有浏览器都默认启用,调用前需检查是否存在,并引导用户授予权限:

  • 检测 window.SpeechRecognitionwindow.webkitSpeechRecognition 是否存在(Chrome 使用带前缀的版本)
  • 首次调用 recognition.start() 时,浏览器会自动弹出麦克风权限请求;若用户拒绝或未授权,需提示手动开启(如进入设置 → 网站设置 → 麦克风)
  • 可在页面加载后尝试一次静默检测,避免用户点击后才报错

初始化并配置 SpeechRecognition 实例

创建识别器后,可设置识别行为,提升实用性:

  • 使用 new (SpeechRecognition || webkitSpeechRecognition)() 创建实例
  • 设置 recognition.continuous = true 支持连续识别(非说完即停)
  • recognition.interimResults = true 可获取中间结果(带下划线的暂定文本),适合实时反馈
  • 指定语言:如 recognition.lang = 'zh-CN'(中文)或 'en-US'(英文)
  • 限制单次识别时长:用 recognition.maxAlternatives = 1 减少冗余结果

监听关键事件并处理识别结果

语音识别是异步过程,依赖事件驱动。核心事件有:

立即学习Java免费学习笔记(深入)”;

  • onstart:麦克风已开启,开始收音
  • onresult:收到识别结果。Event.resultsSpeechRecognitionResultList,每项含多个 SpeechRecognitionAlternative;取 results[results.Length - 1][0].transcript 获取最新文本
  • onend:识别结束(可能因超时、错误或用户停止)。常在此处自动重启recognition.start(),实现“一直听”效果
  • onError:捕获错误,如 error.error === 'no-speech'(没检测到语音)、'aborted'(被中断)或 'not-allowed'(权限被拒)

基础调用示例(可直接运行)

以下代码片段可粘贴进 html 文件,在 Chrome 中测试:

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition; if (!SpeechRecognition) {   console.error('当前浏览器不支持语音识别'); } else {   const recognition = new SpeechRecognition();   recognition.lang = 'zh-CN';   recognition.interimResults = true;   recognition.continuous = true; 

recognition.onresult = (event) => { const transcript = Array.from(event.results) .map(result => result[0].transcript) .join(''); console.log('识别结果:', transcript); };

recognition.onend = () => recognition.start(); // 自动重连 recognition.onerror = (e) => console.warn('识别出错:', e.error);

// 页面加载后等待用户触发,例如点击按钮再 start() document.getElementById('start-btn').onclick = () => recognition.start(); }

text=ZqhQzanResources