関連情報

Speech SDKのインストールと音声認識の設定

SAPIの開発を行うためには、まずSpeech SDKをインストールする必要があります。これには音声認識のライブラリやサンプルコードが含まれています。

Windows Vista以降には、Speech SDKをインストールは必要ありません。Windows VistaにはSAPI 5.3が、Windows 7にはSAPI 5.4がWindows Speech Recognitionとして組み込まれています。

ダウンロード

Microsoft Speech SDK 5.1
対応OS:Windows NT4.0/98/Me/2000/XP

[SpeechSDK51.exe]がSDKの本体で、日本語で音声認識を行わせるには他に[SpeechSDK51LangPack.exe]が必要となります。

インストール

Speech SDK

[SpeechSDK51.exe]は自己解凍形式となっていますので、まずは実行して解凍します。
WinZip Self-Extractor

解凍されたファイルから、[setup.exe]を実行します。
InstallShield Wizard

ライセンスの確認やユーザー名の入力を求められるので、それに従いインストールを進めます。

Visual Studio 2005でSpeech API 5.1を使用するには、ライブラリのヘッダファイル (sphelper.h) を修正する必要があります。

Speech SDK Language Pack (日本語の音声認識エンジン)

[SpeechSDK51LangPack.exe]も自己解凍形式となっていますので、これも解凍します。
WinZip Self-Extractor

[setup.exe]を実行します。
InstallShield Wizard

ライセンス確認とユーザー名の入力の後、セットアップの種類の選択を求められます。中国語での音声認識が不要ならば[Custom]を選択し、カスタムセットアップで[Simplified Chinese engines]を除外します。

セットアップ種類の選択 セットアップ内容の選択

音声認識の設定と調整

コントロールパネルの[音声認識]から各種設定を行えます。

コントロールパネルの音声認識アイコン

言語の選択

音声認識に何語を使用するのかを選択します。既定では英語だけですが、Language Packをインストールすることで日本語と中国語も選択できるようになります。

使用言語の選択

マイクの調整

音声認識のプロパティにある[マイクの構成]から、マイクの接続確認と音量調整を行えます。

音声認識のプロパティのマイクの構成ボタン

マイク ウィザード

認識精度の向上 (プロファイルのトレーニング)

特定の人物の話し方に合うように音声認識エンジンを調整することで、認識精度を向上させることができます。

音声認識のプロパティにある[プロファイルのトレーニング]から行います。

プロファイルのトレーニングボタン

音声トレーニング

音声認識のテスト (Simple Dictation)

Speech SDKに付属しているSimple Dictationで、音声認識のテストを簡単に行えます。

スタートメニューの【Microsoft Speech SDK 5.1 → C++ Samples → Simple Dictation】から起動します。
スタートメニューにあるSimple Dictation

マイクに向かって話しかけると、認識された言葉が文字として表示されます。
Simple Dictationの動作画面

正しく認識されない場合は設定を見直し、マイクの調整やプロファイルのトレーニングを行います。