リアルタイム音声認識 (Book4885521955

リアルタイム音声認識

-リアルタイム音声認識
--http://www.amazon.co.jp/exec/obidos/ASIN/4885521955/nilabwiki-22/ref=nosim/
--安藤彰男著

-音響モデル・言語モデル・発音辞書を利用して、音声を文字へ変換していく

-音響モデル(acoustic model)の学習
--音声データベース(speech database)
--発音記号(phonetic symbols)

-言語モデル(language model)の学習
--形態素解析(morpheme analysis)

-発音辞書(pronunciation dictionary)
--単語(形態素)と発音記号列との対応表

-音声を漢字仮名交じりで登録された言葉に直接変換

-音声生成モデル

-HMM(hidden Markov model)

-窓関数(window function)

-n-gram

-バックオフスムージング(back-off smoothing)

-ビームサーチ

-クロスワードトライフォン(cross-word triphone)

-CMU-Cambridge SLM Toolkit

-音響モデルの学習と適応化

-トライフォンHMM

-フィラー
--「えー」「あのー」などの間投的な単語。

-関連ページ: 音声認識 VoiceRecognition

MemoWiki は NI-Lab. による雑文・リンク集・読書感想文・書評・ブックレビュー・読書まとめメモなど雑多なメモ集です(おおざっぱにいうと)。