Session2 音声メディア Session2 音声メディア [河原 達也教授 研究室]
2nd_pc_border_top.png
音声強調・認識・対話の理論的基盤の講義と最新動向の紹介および、アプリケーション作成からモデルの深層学習演習を行います。
 
河原 達也
京都大学大学院 情報学研究科 知能情報学専攻 教授
河原 達也
 
吉井 和佳
京都大学大学院 情報学研究科 知能情報学専攻 准教授
吉井 和佳
 
井上 昴治
京都大学大学院 情報学研究科 知能情報学専攻 助教
井上 昴治
音声強調・認識・対話の理論的基盤の講義と最新動向の紹介および、アプリケーション作成からモデルの深層学習演習を行います。



京都大学大学院 情報学研究科 知能情報学専攻 教授
河原 達也
河原 達也
 





京都大学大学院 情報学研究科 知能情報学専攻 准教授
吉井 和佳
吉井 和佳
 





京都大学大学院 情報学研究科 知能情報学専攻 助教
井上 昂治
井上 昂治
前提知識 2週目は Linux、Python、Pytorchなどの経験が必要
2nd_pc_border_bottom.png
10月20日(木)
9:30~ 講義 音声技術の展望
深層学習、ビッグデータ
11:00~ 講義 音声認識の概要
音声認識の原理、End-to-Endモデル
12:30~ 休 憩
13:30~ 講義 音声認識の基盤技術
音声分析、音響モデル、HMM、言語モデル、N-gram
15:00~ 演習 音声認識演習(Julius)
文法記述による音声認識システム構築
16:30~
18:00
演習 音声対話システム実装①
音声認識・音声合成
 
10月21日(金)
9:30~ 講義 音声対話の概要
音声対話システムの構成、タスクの分類
11:00~ 講義 音声対話の基盤技術
音声言語理解、応答生成
12:30~ 休 憩
13:30~ 演習 音声対話システム実装②
言語理解
15:00~ 演習 音声対話システム実装③(対話管理)
対話管理
16:30~
18:00
演習 スマートスピーカアプリ実装(Dialogflow)
スマートスピーカなどを想定したアプリ構築
 
10月27日(木)
9:30~ 講義 系列写像学習
Seq2seqモデル、End-to-End認識、CTC、注意機構モデル
11:00~ 演習 Seq2seqモデル学習演習
CTC、注意機構モデル、Acoustic-to-Wordモデル
12:30~ 休 憩
13:30~ 演習 seq2seqモデル学習演習
(同上)
15:00~ 講義 マイクアレイ信号処理の基礎
音の伝達過程、ステアリングベクトル、確率モデル
16:30~
18:00
講義
演習
ビーフォーミング
DS、ML、MVDRビームフォーマ
 
10月28日(金)
9:30~ 講義 音源定位
部分空間法、MUSIC法
11:00~ 講義
演習
音響モデリング
MM/EMアルゴリズム、NMF、VAE
12:30~ 休 憩
13:30~ 講義 ブラインド音源分離
IICA、IVA、ILRMA、MNMF、FastMNMF
15:00~ 演習 ブラインド音源分離
(同上)
16:30~ 講義
演習
音楽分離
U-Net
18:00~ アフターセッション
 
講座について
要項・申込
 
お問い合わせ お問い合わせ
©Kyoto University Original Co., Ltd. All rights reserved. ©Kyoto University Original Co., Ltd. All rights reserved.  
TOP