当サイトは、Javascriptを使用しています。Javascriptを無効にして閲覧した場合、コンテンツが正常に動作しないおそれやページが表示されない場合があります。当サイトをご利用の際には、Javascriptを有効にして閲覧下さい。

革新知能統合研究センター音響情景理解チーム

チームリーダー吉井和佳（Ph.D.）

English Page

研究概要

音声・音楽・環境音など様々な音響信号を対象とした解析技術の研究を行っています。我々は、対象の性質をよく観察した上で、現実的な計算量で推論が実行できることを念頭に、できる限り物理的・理論的に妥当な確率的生成モデルを定式化し、その逆問題を解くアプローチをとっています。従来のベイズ学習に加えて、最近の深層学習の技術を取り入れることで、実世界の音響信号処理にチャレンジします。

研究主分野

コンピューター科学

研究関連分野

工学
数学

研究テーマ

統計的音響信号処理（音源分離/定位・音声強調など）
ベイズ学習（階層ベイズ・ノンパラメトリックベイズなど）
音楽情報処理（音源分離・自動採譜など）

主要論文

「*」は、理研外のみでの成果です。

1.Yoshii, K., Nakamura, E., Itoyama, K., & Goto, M.:
"Infinite Probabilistic Latent Component Analysis For Audio Source Separation"
IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
2.Liutkus, A., & Yoshii, K.:
"A Diagonal Plus Low-Rank Covariance Model For Computationally Efficient Source Separation"
IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
3.*Wake, M., Bando, Y., Mimura, M., Itoyama, K., Yoshii, K., & Kawahara, T.:
"Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation"
IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
4.*Mimura, M., Bando, Y., Shimada, K., Sakai, S., Yoshii, K., & Kawahara, T.:
"Combined Multi-Channel NMF-Based Robust Beamforming for Noisy Speech Recognition"
Annual Conference of the International Speech Communication Association (Interspeech), 2017.
5.*Nishikimi, R., Nakamura, E., Goto, M., Itoyama, K., & Yoshii, K.:
"Scale- and Rhythm-Aware Musical Note Estimation for Vocal F0 Trajectories Based on a Semi-Tatum-Synchronous Hierarchical Hidden Semi-Markov Model"
International Society for Music Information Retrieval Conference (ISMIR), 2017
6.*Tsushima, H., Nakamura, E., Itoyama, K., & Yoshii, K.:
"Function- and Rhythm-Aware Melody Harmonization Based on Tree-Structured Parsing and Split-Merge Sampling of Chord Sequences"
International Society for Music Information Retrieval Conference (ISMIR), 2017
7.*Itakura, K., Bando, Y., Nakamura, E., Itoyama, K., Yoshii, K., & Kawahara, T.:
"Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization"
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 551–555, 2017.
8.*Yoshii K., Tomioka, R., Mochihashi, D., & Goto M.:
"Infinite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals"
International Conference on Machine Learning (ICML), pp. 576–584, 2013.
9.*Yoshii, K., & Goto, M.:
"A Nonparametric Bayesian Multipitch Analyzer Based on Infinite Latent Harmonic Allocation"
IEEE Transactions on Audio, Speech, and Language Processing, Vol. 20, No. 3, pp. 717–730, 2012.

メンバーリスト

主宰者

吉井和佳: チームリーダー

メンバー

NUGRAHA Aditya Arie: 研究員
DI CARLO Diego: 特別研究員
坂東宜昭: 客員研究員
下平英寿: 客員研究員
山田誠: 客員研究員
ZHU Yihua: 研究パートタイマーⅠ
須村允亮: 研究パートタイマーⅠ
大山百々勢: 研究パートタイマーⅠ
藤田陽斗: 研究パートタイマーⅠ

お問い合わせ先

〒606-8501 京都市左京区吉田本町総合研究7号館 412号室
Email: kazuyoshi.yoshii [at] riken.jp
※[at]は@に置き換えてください。

革新知能統合研究センター 音響情景理解チーム