「東京大学大学院情報学環とソニーコンピュータサイエンス研究所(CSL)の研究チームが開発した「Derma」は、喉周辺の皮膚にセンサーを張り付け、口パク(無声発話)を音声入力に変換する深層学習を用いたサイレントスピーチインタラクション(Silent Speech Interaction、SSI) だ。話者の唇や顎(あご)周辺を指で触れ、発話を読み取ろうとする、視聴覚障害者のためのTadoma(触診リップリーディング)法から発想を得ている。Tadoma法では主に唇周辺の皮膚を触って発話を認識しているが、今回の研究ではそれを機械学習により自動化した。さらにウェアラブルでの利用を想定し、より目立ちにくい顎下(がっか)の皮膚からも発話が推定できることを示している。」 口パクで音声入力、喉に小型センサーで 東大とソニーCSLが技術開発:Innovative Tech - ITmedia NEWS https://www.itmedia.co.jp/news/articles/2003/18/news046.html
[Mastodon] 2024-08-01 13:32:00
|