AI人工智能 语音识别

AI百科6个月前更新 快创云
59 0

。 没有 ASR,就不可能想象一个认知机器人与人进行交互。 但是,构建识别器并不容易。

识别系统的困难

高质量的识别系统确实是一个难题。 识别技术的困难可以广泛地表征为如下所讨论的许度 –

词汇大小

例如,在一个菜单系统中,一个小词汇由 2 到 100 个单词组成

例如,在数据库检索任务中,中等大小的词汇包含几个 100 到 1000 个单词

一个大的词汇由几万个单词组成,如在一般的听写任务中。

噪音类型

噪音是 ASR 时需要考虑的另一个因素。 信噪比可以在各种范围内,这取决于观察较少的声学环境与较多的背景噪声 –

平均水平或低于平均水平。 此外,嘴和微型电话之间的距离可能会有所不同。 识别系统也应考虑这些因素。

记录 当必须从文件中读取音频时,首先使用麦克风录制

采样 用麦克风录音时,以数字形式存储。 但为了解决这个问题,机器需要使用离散数字形式。 因此,我们应该以某个频率进行采样,并将转换为离散数字形式。 选择高频采样意味着当人类听到时,他们会感觉它是一个连续的音频。

示例

以下示例显示了使用 Python 存储在文件中的逐步音频的方法。 这个音频的频率是 44,100HZ。

下面导入必要的软件包

现在,读取存储的音频文件。 它会返回两个值采样频率和音频。 提供存储音频文件的路径,如下所示

使用显示的命令显示音频的采样频率,的数据类型及其持续时间等参数

这一步涉及如下所示对进行标准化

在这一步中,从这个中提取出前 100 个值进行可视化。 为此目的使用以下命令

现在,使用下面给出的命令可视化

下面输出图形是上述音频提取的数据,如图所示

表征音频涉及将时域转换为频域,并通过以下方式理解其频率分量。 这是一个重要的步骤,因为它提供了关于的大量信息。 可以使用像傅立叶变换这样的数学工具来执行此转换。

示例

以下示例将逐步说明如何使用存储在文件中的 Python 来表征。 请注意,这里使用傅里叶变换数学工具将其转换为频域。

导入必要的软件包,如下所示

现在,读取存储的音频文件。 它会返回两个值采样频率和音频。 提供存储音频文件的路径,如命令所示

在这一步中,将使用下面给出的命令显示音频的采样频率,的数据类型和持续时间等参数

在这一步中,我们需要对进行标准化,如下面的命令所示

这一步涉及提取的长度和半长。使用以下命令 –

现在,需要应用数学工具来转换到频域。 这里使用傅里叶变换。

现在,进行频域的归一化并将其平方

接下来,提取频率变换的长度和一半长度

请注意,傅里叶变换必须针对奇偶情况进行调整。

现在,以分贝(dB)为单位提取功率

调整X轴的以kHz为单位的频率

现在,将的特征可视化如下

可以观察上面代码的输出图形,如下图所示

到目前为止你所看到的两个步骤对于了解很重要。 现在,如果要使用某些预定义参数生成音频,此步骤将很有用。 请注意,此步骤会将音频保存在输出文件中。

示例

在下面的例子中,我们将使用 Python 生成一个单调,它将被存储在一个文件中。需要采取以下步骤 –

导入必要的软件包

指定输出保存的文件

现在,指定选择的参数,如图所示

在这一步中,我们可以生成音频,如下代码所示

现在,将音频文件保存在输出文件中

如图所示,提取图形的前100个值

现在,将生成的音频可视化如下

可以观察这里给出的图形

这是构建识别器的最重要步骤,因。 可以为此使用不同的特征提取技术,如 MFCC,PLP,PLP-RASTA 等。

示例

在以下示例中,我们将使用 MFCC 技术逐步使用 Python 从中提取特征。

导入必要的软件包,如下所示

现在,读取存储的音频文件。 提供存储音频文件的路径。

请注意,在此首先抽取个样本进行。

使用 MFCC 技术并执行以下命令来提取 MFCC 特征

现在,打印 MFCC 参数,如下所示

使用下面给出的命令绘制并可视化 MFCC 特征

在这一步中,我们使用如下滤器组特征,提取过滤器组特征

现在,打印过滤器组参数。

绘制并可视化过滤器组特征。

根据上述步骤,您可以观察到以下输出图1为 MFCC,图2为过滤器组。

。 需要为此安装以下软件包

Pyaudio – 它可以通过使用 pip 安装 Pyaudio 命令进行安装

SpeechRecognition – 这个软件包可以通过使用 进行安装。

Google-Speech-API – 可以使用命令 进行安装。

实例

观察下面的例子来理解口语的识别。如下所示导入必要的软件包

创建一个对象,如下所示

现在,Microphone()模块将把作为输入

现在谷 API 会识别并提供输出。

可以看到下面的输出

例如,如果您说yiibai.com,那么系统会如下正确识别它 –

© 版权声明

相关文章