音声認識システム (IT Text)

-音声認識システム (IT Text)
--http://www.amazon.co.jp/exec/obidos/ASIN/4274132285/nilabwiki-22/ref=nosim/
--情報処理学会, 鹿野 清宏, 伊藤 克亘, 河原 達也, 武田 一哉, 山本 幹雄 編著

-本書のサポートサイト
--Japanese Dictation Toolkit - Free Software Repository for Automatic Speech Recognition -
---http://winnie.kuis.kyoto-u.ac.jp/dictation/

-「CMU-Cambridge 統計的言語モデルツールキット」の解説と使い方(設定ファイルやコマンドの実行例)

-情報処理振興事業協会(IPA)の独創的先進的情報技術に係わる研究開発

-「大語彙連続音声認識エンジン Julius」の解説と使い方(設定ファイルやコマンドの実行例)

-付録CD-ROMの中身
--日本語ディクテーション基本ソフトウェア最終版(Julius等)
--計算機を用いた演習課題
--毎日新聞社記事データ91〜97年版

-Ohmsha - IT Text 音声認識システム
--http://ssl.ohmsha.co.jp/cgi-bin/menu.cgi?ISBN=4-274-13228-5
--->著者:奈良先端科学技術大学院大学 鹿野 清宏 産業技術総合研究所 伊藤 克亘 京都大学 河原 達也 名古屋大学 武田 一哉 筑波大学 山本 幹雄 編著
---
--->詳細目次
--->1章 音声特徴量の抽出
---> 1.1 音声の生成
---> 1.2 音声信号のスペクトル分析
---> 1.3 音声特徴抽出の実際
--->2章 HMM音素モデルの作成
---> 2.1 隠れマルコフモデル
---> 2.2 HMMの学習
---> 2.3 高度な分布関数の利用
---> 2.4 音素HMMの高度化
--->3章 HMMを用いた音声認識
---> 3.1 音素HMMを用いた単語認識
---> 3.2 連続音声認識の基本原理
--->4章 統計的言語モデル
---> 4.1 Nグラムモデルとは
---> 4.2 Nグラム確率の算出
---> 4.3 テキストの集計とモデルの作成
---> 4.4 言語モデルの評価
---> 4.5 統計的言語モデルの今後
--->5章 日本語の統計的言語モデルの作成
---> 5.1 形態素解析
---> 5.2 言語モデルの作成
--->6章 大語彙連続音声認識アルゴリズム
---> 6.1 問題とアプローチ
---> 6.2 探索アルゴリズム
---> 6.3 各モデルの実装と適用
---> 6.4 マルチパス探索
---> 6.5 典型的な認識アルゴリズム
--->7章 音声/言語データベース
---> 7.1 音声/言語データベースとは
---> 7.2 音声/言語データベースの構成
---> 7.3 音声データベースの現状
---> 7.4 日本音響学会の音声データベース
---> 7.5 RWCPテキストデータベース
--->8章 日本語ディクテーション基本ソフトウェア
---> 8.1 背景
---> 8.2 モデルとプログラムの仕様
---> 8.3 日本語ディクテーションシステム
---> 8.4 モジュールとシステムの評価
---> 8.5 本ソフトウェアの特徴
--->付録A CMU-Cambridge統計的言語モデルツールキット
--->付録B 大語彙連続音声認識エンジンJulius

-CMU-Cambridge SLM Toolkit
-CMU-Cambridge Statistical Language Modeling Toolkit
-Statistical Language Modeling Toolkit
--http://svr-www.eng.cam.ac.uk/~prc14/toolkit.html

-大語彙連続音声認識エンジン Julius
--Julius: http://julius.sourceforge.jp/