1. Home
  2. 研究室紹介
  3. 革新知能統合研究センター
  4. 目的指向基盤技術研究グループ

革新知能統合研究センター 音響情景理解チーム

チームリーダー 吉井 和佳(Ph.D.)

研究概要

吉井 和佳 (Ph.D.)

音声・音楽・環境音など様々な音響信号を対象とした解析技術の研究を行っています。我々は、対象の性質をよく観察した上で、現実的な計算量で推論が実行できることを念頭に、できる限り物理的・理論的に妥当な確率的生成モデルを定式化し、その逆問題を解くアプローチをとっています。従来のベイズ学習に加えて、最近の深層学習の技術を取り入れることで、実世界の音響信号処理にチャレンジします。

研究主分野

  • コンピューター科学

研究関連分野

  • 工学
  • 数学

研究テーマ

  • 統計的音響信号処理(音源分離/定位・音声強調など)
  • ベイズ学習(階層ベイズ・ノンパラメトリックベイズなど)
  • 音楽情報処理(音源分離・自動採譜など)

主要論文

「*」は、理研外のみでの成果です。

  • 1.Yoshii, K., Nakamura, E., Itoyama, K., & Goto, M.:
    "Infinite Probabilistic Latent Component Analysis For Audio Source Separation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  • 2.Liutkus, A., & Yoshii, K.:
    "A Diagonal Plus Low-Rank Covariance Model For Computationally Efficient Source Separation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  • 3.*Wake, M., Bando, Y., Mimura, M., Itoyama, K., Yoshii, K., & Kawahara, T.:
    "Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation"
    IEEE International Workshop on Machine Learning for Signal Processing (MLSP), 2017.
  • 4.*Mimura, M., Bando, Y., Shimada, K., Sakai, S., Yoshii, K., & Kawahara, T.:
    "Combined Multi-Channel NMF-Based Robust Beamforming for Noisy Speech Recognition"
    Annual Conference of the International Speech Communication Association (Interspeech), 2017.
  • 5.*Nishikimi, R., Nakamura, E., Goto, M., Itoyama, K., & Yoshii, K.:
    "Scale- and Rhythm-Aware Musical Note Estimation for Vocal F0 Trajectories Based on a Semi-Tatum-Synchronous Hierarchical Hidden Semi-Markov Model"
    International Society for Music Information Retrieval Conference (ISMIR), 2017
  • 6.*Tsushima, H., Nakamura, E., Itoyama, K., & Yoshii, K.:
    "Function- and Rhythm-Aware Melody Harmonization Based on Tree-Structured Parsing and Split-Merge Sampling of Chord Sequences"
    International Society for Music Information Retrieval Conference (ISMIR), 2017
  • 7.*Itakura, K., Bando, Y., Nakamura, E., Itoyama, K., Yoshii, K., & Kawahara, T.:
    "Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization"
    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 551–555, 2017.
  • 8.*Yoshii K., Tomioka, R., Mochihashi, D., & Goto M.:
    "Infinite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals"
    International Conference on Machine Learning (ICML), pp. 576–584, 2013.
  • 9.*Yoshii, K., & Goto, M.:
    "A Nonparametric Bayesian Multipitch Analyzer Based on Infinite Latent Harmonic Allocation"
    IEEE Transactions on Audio, Speech, and Language Processing, Vol. 20, No. 3, pp. 717–730, 2012.

関連リンク

メンバーリスト

主宰者

吉井 和佳
チームリーダー

メンバー

NUGRAHA Aditya Arie
研究員
DI CARLO Diego
特別研究員
坂東 宜昭
客員研究員
下平 英寿
客員研究員
山田 誠
客員研究員
ZHU Yihua
研究パートタイマーⅠ
須村 允亮
研究パートタイマーⅠ
大山 百々勢
研究パートタイマーⅠ
藤田 陽斗
研究パートタイマーⅠ

お問い合わせ先

〒606-8501 京都市左京区吉田本町 総合研究7号館 412号室
Email: kazuyoshi.yoshii [at] riken.jp
※[at]は@に置き換えてください。

Top