研究紹介

Home > 研究紹介 > 革新知能統合研究センター > 目的指向基盤技術研究グループ >

革新知能統合研究センター

音響情景理解チーム

チームリーダー 吉井 和佳 (Ph.D.)
吉井 和佳 (Ph.D.)

音響情景理解チームでは、音声・音楽・環境音など様々な音響信号を対象とした解析技術の研究を行っています。我々は、対象の性質をよく観察した上で、現実的な計算量で推論が実行できることを念頭に、できる限り物理的・理論的に妥当な確率的生成モデルを定式化し、その逆問題を解くアプローチをとっています。従来のベイズ学習に加えて、最近の深層学習の技術を取り入れることで、実世界の音響信号処理にチャレンジします。

研究主分野

コンピューター科学

研究関連分野

工学 / 数学

研究テーマ

  • 統計的音響信号処理(音源分離/定位・音声強調など)
  • ベイズ学習(階層ベイズ・ノンパラメトリックベイズなど)
  • 音楽情報処理(音源分離・自動採譜など)

主要論文

「*」は、理研外のみでの成果です。
  1. Yoshii, K., Nakamura, E., Itoyama, K., & Goto, M.:
    "Infinite Probabilistic Latent Component Analysis For Audio Source Separation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  2. Liutkus, A., & Yoshii, K.:
    "A Diagonal Plus Low-Rank Covariance Model For Computationally Efficient Source Separation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  3. *Wake, M., Bando, Y., Mimura, M., Itoyama, K., Yoshii, K., & Kawahara, T.:
    "Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  4. *Mimura, M., Bando, Y., Shimada, K., Sakai, S., Yoshii, K., & Kawahara, T.:
    "Combined Multi-Channel NMF-Based Robust Beamforming for Noisy Speech Recognition"
    Annual Conference of the International Speech Communication Association (Interspeech), 2017.
  5. *Nishikimi, R., Nakamura, E., Goto, M., Itoyama, K., & Yoshii, K.:
    "Scale- and Rhythm-Aware Musical Note Estimation for Vocal F0 Trajectories Based on a Semi-Tatum-Synchronous Hierarchical Hidden Semi-Markov Model"
    International Society for Music Information Retrieval Conference (ISMIR), 2017
  6. *Tsushima, H., Nakamura, E., Itoyama, K., & Yoshii, K.:
    "Function- and Rhythm-Aware Melody Harmonization Based on Tree-Structured Parsing and Split-Merge Sampling of Chord Sequences"
    International Society for Music Information Retrieval Conference (ISMIR), 2017
  7. *Itakura, K., Bando, Y., Nakamura, E., Itoyama, K., Yoshii, K., & Kawahara, T.:
    "Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization"
    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 551–555, 2017.
  8. *Yoshii K., Tomioka, R., Mochihashi, D., & Goto M.:
    "Infinite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals"
    International Conference on Machine Learning (ICML), pp. 576–584, 2013.
  9. *Yoshii, K., & Goto, M.:
    "A Nonparametric Bayesian Multipitch Analyzer Based on Infinite Latent Harmonic Allocation"
    IEEE Transactions on Audio, Speech, and Language Processing, Vol. 20, No. 3, pp. 717–730, 2012.

お問い合わせ先

〒606-8501 京都市左京区吉田本町 総合研究7号館 412号室
Tel: 075-753-5386
Fax: 075-753-5977

yoshii [at] kuis.kyoto-u.ac.jp
※[at]は@に置き換えてください。

関連リンク

Home > 研究紹介 > 革新知能統合研究センター > 目的指向基盤技術研究グループ >