PICマイコンと組込ボードのプロフェッショナル
 

UART制御-音声認識モジュール [SR-MOD100C]

商品名 : UART制御-音声認識モジュール [SR-MOD100C]

商品コード : 7902778003

価格 : 5,400円(税込)

数量 :

UART音声認識組込モジュール(型式;SR-MOD100C)は45mm×24mmの小さなボードに音声認識に必要な機能を凝縮した組込用の音声認識モジュールです.
 

端子に付属のコンデンサマイクを装着することで,あらかじめ登録しておいた音声フレーズを認識して非同期式シリアル通信(UART)にてどの音声が入力されたのかを番号で出力します.
 

SR-MOD100Cは、不特定の話者が発話した内容も認識できるSIフレーズにユーザーが自由なフレーズを登録できるようになりました.
これにより様々な機器に音声認識の機能を組み込むことができるようになります.

ロボット関連をはじめ「声」で制御する様々な機器に搭載されご好評頂いているベストセラーボードです.

 


SR-MOD100Cには,音声認識できるフレーズが大きく分けて2つあります.

1つは,特定の人の声を認識できる
特定話者認識フレーズ(SDフレーズ).
2つ目は,誰の声でも認識できる
不特定話者認識フレーズ(SIフレーズ)です.

特定話者認識フレーズ(SD)は,お客様が好きなフレーズを最大32フレーズまで(※1)登録させて認識できます.
登録は簡単で,コマンドによって登録操作をした後,登録したいフレーズをマイクに向かって2回発話するだけ.これで登録が完了しそのフレーズを認識できるようになります.ロボット製作者の方は,「発進」「停止」「後退」・・・など様々なフレーズを登録して声による制御を行っています.
なお,このSDフレーズ何回も削除したり変更したりすることができます.

但し,SDフレーズは話者が特定されていますので,登録作業を行った方の声のみ認識対象となります.話者が違うと認識率が大幅に下がります.



















上図はSDフレーズの例です.

一方,
不特定話者認識フレーズ(SI)は発話者を限定せず,誰の声でも認識できるフレーズです.
認識できるフレーズは,標準であらかじめ登録されている下表の25フレーズです.

このSIフレーズはお客様ご自身でフレーズ登録はできませんが,当方ではご希望のフレーズ8つまでをご注文時に申請して頂くことで,無償で登録しお届けするサービスを行っております.
またそれ以上のSIフレーズは有償にて最大20語まで登録可能です.



















上図はSIフレーズの例です.

あらかじめ登録されているSIフレーズ25フレーズ一覧は本ページ下部にあります.

それ以外の不特定話者認識フレーズをお使いになりたい場合には最大8個まで無償で登録を承ります.
 
※本製品はすべての場合に対して音声認識の精度を保証するものではありません.
 

※1:32フレーズとはパスワードフレーズ(SVフレーズ)の5フレーズを除いた場合の登録可能数です.SVフレーズを登録するとその分特定話者認識フレーズ(SDフレーズ)の32フレーズの登録可能数は減ります.SVフレーズを最大の5フレーズ登録するとSDフレーズは27フレーズとなります.


特定話者認識フレーズ(SDフレーズ)はお客様ご自身で好きなフレーズを何回も登録や削除変更が可能ですが,話者を問わず認識可能な不特定話者フレーズ(SIフレーズ)は本体にあらかじめ登録された25フレーズと,別途ご注文時に申請頂いた最大20フレーズがご利用頂けます.ご申請は8フレーズまでは無償で登録を承ります.

SR-MOD100Cをご注文後、専用申請ページからSIフレーズをご申請ください.フレーズ登録を完了させた状態で納品致します.
 

登録した内容は本体の不揮発性メモリーに記憶され,お客様ご自身による変更や削除はできません.また同じフレーズ内容の製品を複数作ることも可能です.
 

カスタムSIフレーズ登録の手引きをご用意致しました。登録フレーズについての注意事項などが記載されております。こちらをご参照ください.


※発話する方が決まっているような場合にはSIフレーズの登録は必要ありません.お客様ご自身でSDフレーズとして登録できます.

 


 


すべての制御はTX線とRX線の2線式の非同期式シリアル通信(UART)となります.

ロジック電圧レベルは0V-5V又は0V-3.3VですのでPICマイコン等のTTL回路と直結して利用可能です.


音声認識させるフレーズはすべてグループ分けして,そのグループ内に番号0から順番に登録させることができます。下記例では、Group1に0〜4までの5つのフレーズが登録されています。
 


登録内容は,SDフレーズ,SIフレーズいずれも本体の不揮発性メモリーに記憶され電源を切断してもフレーズや学習内容は保持されます.次の手順で認識ができます.

1音声認識を開始するコマンド(64h)と.グループを指定する値をマイコン等から本機に送信します.上例の場合,Group1を指定します.
本機は上記コマンドを受信すると音声入力の待機状態となります.(待機時間は設定できます.)

2.マイクに向かってフレーズを発声します.例えば「ストップ」と発声します.

3.本機で音声が認識されます.指定したグループ内に該当するフレーズがあると認識すると認識完了コマンドと,認識したフレーズが Group1のIndex番号2に該当する音声だった ことをシリアル通信で出力します.

4.マイコン等のUART制御機器側は,本機から送られてくるコマンドを読むだけでどの音声が発声されたのかが分かります.

上例の場合にはグループ1を指定していて,認識結果の戻り値が「2」であれば話者が「ストップ」と発話したのということがマイコン側で検出できます.

 


※上記模式図の手順3では実際には73hの後に次の値を送信させるためにマイコン側から20hを送信する必要があります.
 

※不特定話者フレーズ(SIフレーズ)は、あらかじめ登録されているものについては順番の変更やグループ分けの変更はできません.またカスタム登録したSIフレーズは申請された時の順番,グループ分けで登録されており,この内容を後から変更することはできません。


SR-MOD100Cのインターフェイスピンは,mikroBUS規格に準じた並びになっていますので,当方で販売している統合評価ボードやClickerベースボードにそのまま装着してご利用になれます.



 


フレーズの登録や管理はすべてUARTコマンドなのでマイコン等からも行えますが,パソコンと接続すれば専用のユーティリティソフトで簡単に制御・管理ができます.
パソコンとの接続には当方で販売しているUSB接続アダプタ(型式QUICK-USB)がおすすめです.

 

ユーティリティソフトでは,SR-MOD100Cのすべての機能をパソコン上から操作することができます.またフレーズ登録の際の文字列登録や,フレーズ学習の回数管理なども行うことができます.
 

動作確認も簡単.フレーズ登録,学習をさせた後に音声認識開始ボタンを押してSR-MOD100Cのマイクに向かって発声するだけです.登録されたフレーズと一致すればそのフレーズを反転表示します.
 



SR-MOD100Cにはもう一つ特別な機能が付いています.

同じフレーズに対して話者を判別できる「話者特定フレーズ機能」も搭載しています.

この機能は同じフレーズに対して,最大5人までの音声を学習登録させることで、声質から話者を識別する機能です.

例えば,同じフレーズ「ぱすわーど」を登録しておき,これに5人までの話者が発声して学習、登録させておきます.
SR-MOD100Cは,5人の話者の声質を分析し記憶.話者特定フレーズ認識を実行し,マイクより「ぱすわーど」と音声を入力すると,どの話者の声なのかを特定してその結果を出力します.



声質によって識別ができるため,誰が発した音声なのかを識別することができます.
パスワードのような機能ですので,例えば特定の発話者が発した場合にのみ,鍵を開ける扉のおもちゃや,発話者の名前を表示させるアプリケーションなどに応用できます.



※本機能は話者を完全に特定及び認識できることを保証するものではありません.よって,セキュリティが求められる場所へは適用できません.あくまでもホビーユースの範囲内でご使用ください.
 


使用可能言語は日本語はもちろんのこと,英語・イタリア語・ドイツ語・フランス語・スペイン語の6カ国語に標準で対応.



※カスタムSIフレーズは,現在のところ日本語だけの登録となっています.


※他言語を母国語としない日本人が、他言語(例えばドイツ語)などを、ネイティブとは異なる発音で発声した場合、ドイツ語設定をしていても正しく認識しません。各言語はそれぞれの言語を母国語とする話者が、正しいイントネーションで発声した場合に認識されるよう最適化されています。


不特定話者登録フレーズ一覧(日本語)

不特定話者フレーズWordset 1
アクション 進め 曲がれ 走れ 見ろ 攻撃 止まれ
こんにちは
不特定話者フレーズWordset 2
後ろ
不特定話者フレーズWordset 3
ゼロ イチ サン ヨン ロク
ナナ ハチ キュウ又はク ジュウ

上記25語は、話者が誰であっても共通して認識できるフレーズです.
 

不特定話者認識フレーズの追加は8つまで無償で登録を承ります.くわしくはこちらをご覧ください。
 


搭載機能一覧
 
25語の不特定話者認識フレーズ 話者を問わない25語の共通フレーズがあらかじめ登録されています。
登録できるカスタムSIフレーズ 別途申請により、8フレーズまで任意の不特定話者フレーズが無償で本体に登録できます。汎用的なフレーズから特殊なフレーズまで日本語ならば色々な音声を登録できます。
最大32語の話者特定フレーズ 特定の話者の声を認識する話者特定フレーズを、最大で32語まで登録させることが可能です。5秒以内のフレーズで、任意のフレーズを登録させることができます。
データは不揮発性メモリーに記憶 登録や学習させたフレーズはすべて内部の不揮発性メモリーに記憶されます。よって電源を切断してもその内容は保持され、学習内容も記憶されています。
UARTによる簡単制御で音声認識 すべてのコマンドは非同期式シリアル通信(UART)で行いますので、PICマイコンなどのワンチップマイコンと接続して、簡単に音声認識機能をあなたのアプリケーションに追加できます。通信速度は5段階から選べます。
標準で6カ国語に対応 標準で日本語・ 英語・イタリア語・ドイツ語・フランス語・スペイン語 の6カ国語に対応しています。ネイティブの発音で正しく認識するように設計されています。
話者特定フレーズ機能を搭載 最大5人までの話者の声質を登録することで、誰が発声した音声なのかを識別することができます。ホビーユースの範囲で、声で開く電子錠アプリケーションなどに応用可能です。
高精度な音声認識エンジンを搭載 精度の高い音声認識エンジンを搭載しています。方言やなまりなどが強い場合、背景雑音が多い場合に等は認識精度が落ちることがありますが、高い精度で音声認識を行うことができます。
5V電源で簡単運用、省電力モードも搭載 電源電圧は+5Vです。TTL回路と直結できます。また省電力モードを搭載しています。

音声認識精度に関するご注意

本製品は高精度な音声認識エンジンを搭載していますが、その認識精度は様々な要因によって影響を受けます。例えば方言やなまりが強い言葉であったり、登録学習した時とことなる声質だったりすると、精度が悪くなることがあります。また、背景雑音(周囲がざわついている)の多い場所や、小さい声・極端に大きな声などでは正しく認識できないことがあります。

本製品は、音声認識を行う製品ですが、その認識精度について保証するものではありません。誤認識する場合や、認識ができない場合も想定して本製品をご検討頂けますようお願い致します。また、本製品はホビーユースの範囲での使用を前提に作られておりますので、高い精度が期待されるアプリケーションではご使用にならないようお願い致します。



本製品のマニュアルは こちら からご覧頂けます。 (PDF)


カスタム不特定話者フレーズの登録はこちらから行えます。なおカスタムSIフレーズ登録をされる場合には、先に本製品をこちらのページで必要台数ご注文頂き通信欄に「SIカスタムフレーズ登録希望」とお書き添えください。
 


主な仕様
電源電圧 DC5V
消費電流 通常動作時:最大15mA程度
省電力モード時:約0.25mA程度
対応言語 日本語・英語・イタリア語・ドイツ語・フランス語・スペイン語
シリアルインターフェイス
非同期式シリアル通信(UART)
TTLレベル、通信速度 9.6kbps , 38,4kbps , 57.6kbps , 115.2kbps

デフォルトは9.6kbps設定になっています。

ボード寸法 縦56.4×横25.4mm


セット内容
 

SR-MOD100C本体

コンデンサマイク(約10cm)

 
 

※マニュアル及びサポートソフトウエアは、インターネットからの ダウンロード となります。

オプション品 


 

パソコン接続ケーブル

SR-MOD100CをパソコンのUSBポートと簡単に接続できるUSB-UART変換機能を内蔵したケーブルです.

販売価格: 2,500円

 
mikroBUS
PIC32MX534F064H搭載 PIC CLICKERベースボード [CLICK-32MX]
PIC32MX534F064H搭載 PIC CLICKERベースボード [CLICK-32MX]
WiFiモジュール(ESP-WROOM-02) ブレークアウトボード Ver.2 [BB-ESP-WROOM02-2]
WiFiモジュール(ESP-WROOM-02) ブレークアウトボード Ver.2 [BB-ESP-WROOM02-2]
3次元測位 LEA-6S搭載 GPSクリックボード [CLICK-GPS]
3次元測位 LEA-6S搭載 GPSクリックボード [CLICK-GPS]
(GPS)
パルスオキシメーター&ハートレートセンサーICボード [CLICK-10]
パルスオキシメーター&ハートレートセンサーICボード [CLICK-10]

ページトップへ