Session2 音声メディア Session2 音声メディア [河原研究室]
2nd_pc_border_top.png
音声強調・認識・対話の理論的基盤の講義と最新動向の紹介および、アプリケーション作成からモデルの深層学習演習を学びます。

 
河原 達也
京都大学大学院 情報学研究科 知能情報学専攻 教授
河原 達也
河原 達也
前提知識 2週目は Linux, Python, Pytorchなどの経験
2nd_pc_border_bottom.png
10月17日(木)
9:30~ 講義 音声技術の展望
深層学習、ビッグデータ
11:00~ 講義 音声認識の概要
音声認識の原理、End-to-Endモデル
12:30~ 休 憩
13:30~ 講義 音声認識の基盤技術
音声分析、音響モデル、HMM、言語モデル、N-gram
15:00~ 演習 音声認識演習 (Julius)
文法記述による音声認識システム構築
16:30~    
統計的言語モデルによる音声認識構築
18:00~ 懇親会
 
10月18日(金)
9:30~ 講義 音声対話の概要
音声対話システムの構成タスクの分類
11:00~ 講義 音声対話の基盤技術
音声言語理解、応答生成
12:30~ 休 憩
13:30~ 演習 音声対話演習 (MMDAgent)
MMDAgentを用いた音声対話エージェントの構築
15:00~ 演習 音声対話演習 (Dialogflow)
Dialogflowを用いた音声対話システムの構築
16:30~ 演習 音声対話演習アプリ作成
スマートスピーカなどを想定したアプリ構築
 
10月24日(木)
9:30~ 講義 系列写像学習
Seq2seqモデル、End-to-End認識、CTC、注意機構モデル
11:00~ 演習 実習環境の準備
 
12:30~ 休 憩
13:30~ 演習 seq2seqモデル学習演習 (Speech Commands)
CTC
15:00~    
注意機構モデル
16:30~    
Acoustic-to-Wordモデル
 
10月25日(金)
9:30~ 講義 音声強調
雑音・残響抑圧マイクロフォンアレイ
11:00~ 講義 音声分離
NMF、VAE、ディープクラスタリング
12:30~ 休 憩
13:30~ 演習 音声強調・分離演習
NMF、VAE
15:00~    
DNNによるマスク推定
18:00~ 懇親会
 
講座について
要項・申込
 
お問い合わせ お問い合わせ
©Kyoto University Original Co., Ltd. All rights reserved. ©Kyoto University Original Co., Ltd. All rights reserved.  
TOP