51hhh 35d18deb43 [CF]添加audioClassifier.js，导出主要接口

[DOC]更新音频文档

2025-08-14 14:35:44 +08:00

浏览器音频分类器 (背景噪音分离增强版)

简介

这个项目是一个基于浏览器的音频分类器，它利用 TensorFlow.js 和 Speech Commands 模型，可以识别用户自定义的声音类别。与传统音频分类器不同的是，此版本特别强调了背景噪音的分离和处理，从而提升分类准确率。

此应用允许用户：

建议使用live server插件开启本地服务器，并访问voice.html文件。

注：直接打开index.html文件会需要重复授权麦克风权限，请使用live server插件开启本地服务器可以解决

audioClassifier.js文件中主要实现了以下功能：

.
├── README.md
├── script.js
├── voice.html
├── audioClassifier.js
├── speech-commands(js文件仓库,不需要关注)
│   └── ...
└──

TODO

需要查看speech-commands接口实现传入collectExample

.\speech-commands\src\browser_fft_recognizer.ts 667,9: async collectExample(word: string, options?: ExampleCollectionOptions):

现在实现的方法是调用collectExample方法，传入word参数，然后会自动录制音频文件，统一码率，生成频谱图，传入模型，并没有给出可以直接传入音频接口。

如果需要实现一次性录制，需要实现手动将音频文件转换成频谱图，传入模型。

目录下speech-commands文件夹是导入的https://cdn.jsdelivr.net/npm/@tensorflow-models/speech-commands@latest/dist/speech-commands.min.jsjs文件仓库