革新知能統合研究センター 音響情景理解チーム
チームリーダー 吉井 和佳(Ph.D.)
研究概要

音声・音楽・環境音など様々な音響信号を対象とした解析技術の研究を行っています。我々は、対象の性質をよく観察した上で、現実的な計算量で推論が実行できることを念頭に、できる限り物理的・理論的に妥当な確率的生成モデルを定式化し、その逆問題を解くアプローチをとっています。従来のベイズ学習に加えて、最近の深層学習の技術を取り入れることで、実世界の音響信号処理にチャレンジします。
研究テーマ:
- 統計的音響信号処理(音源分離/定位・音声強調など)
- ベイズ学習(階層ベイズ・ノンパラメトリックベイズなど)
- 音楽情報処理(音源分離・自動採譜など)
研究主分野
- コンピューター科学
研究関連分野
- 工学
- 数学
主要論文
- 1.
Yoshiaki Sumura, Diego Di Carlo, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Joint Audio Source Localization and Separation With Distributed Microphone Arrays Based on Spatially-Regularized Multichannel NMF."
IEEE International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 145-149, September 2024. - 2.
Liam Kelley, Diego Di Carlo, Aditya Arie Nugraha, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"RIR-in-a-Box: Estimating Room Acoustics from 3D Mesh Data through Shoebox Approximation."
Annual Conference of the International Speech Communication Association (Interspeech), pp. 3255–3259, September 2024. - 3.
Diego Di Carlo, Aditya Arie Nugraha, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Neural Steerer: Novel Steering Vector Synthesis with a Causal Neural Field over Frequency and Direction."
IEEE International Conference on Acoustics, Speech, and Signal Processing Workshops (ICASSPW), pp. 740–744, April 2024. - 4.
Aditya Arie Nugraha, Diego Di Carlo, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Time-Domain Audio Source Separation Based on Gaussian Processes with Deep Kernel Learning."
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), pp.1–5, October 2023. - 5.
Yoshiaki Bando, Yoshiki Masuyama, Aditya Arie Nugraha, Kazuyoshi Yoshii.:
"Neural Fast Full-Rank Spatial Covariance Analysis for Blind Source Separation."
European Signal Processing Conference (EUSIPCO),pp. 51–55, September 2023. - 6.
Kouhei Sekiguchi, Aditya Arie Nugraha, Yicheng Du, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Direction-Aware Adaptive Online Neural Speech Enhancement with an Augmented Reality Headset in Real Noisy Conversational Environments."
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 266–9273, October 2022. - 7.
Yicheng Du, Aditya Arie Nugraha, Kouhei Sekiguchi, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments."
Annual Conference of the International Speech Communication Association Interspeech), pp. 2918–2922, September 2022. - 8.
Aditya Arie Nugraha, Kouhei Sekiguchi, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"DNN-Free Low-Latency Adaptive Speech Enhancement Based on Frame-Online Beamforming Powered by Block-Online FastMNMF."
IEEE International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 1–5, September 2022. - 9.
Kouhei Sekiguchi, Yoshiaki Bando, Aditya Arie Nugraha, Mathieu Fontaine, Kazuyoshi Yoshii, Tatsuya Kawahara.:
"Autoregressive Moving Average Jointly-Diagonalizable Spatial Covariance Analysis for Joint Source Separation and Dereverberation."
IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 30, pp. 2368–2382, 2022. - 10.
Mathieu Fontaine, Kouhei Sekiguchi, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Generalized Fast Multichannel Nonnegative Matrix Factorization Based on Gaussian Scale Mixtures for Blind Source Separation."
IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 30, pp. 1734–1748, 2022.
関連リンク
メンバーリスト
主宰者
- 吉井 和佳
- チームリーダー
メンバー
- NUGRAHA Aditya Arie
- 研究員
- DI CARLO Diego
- 特別研究員
- 坂東 宜昭
- 客員研究員
- 下平 英寿
- 客員研究員
- 山田 誠
- 客員研究員
- FONTAINE Mathieu Francois Gustave
- 客員研究員
- 大山 百々勢
- 研究パートタイマーⅠ
- 藤田 陽斗
- 研究パートタイマーⅠ
- 小野 稜介
- 研究パートタイマーⅡ
- 二瓶 竜乃介
- 研究パートタイマーⅡ
お問い合わせ先
〒606-8501 京都市左京区吉田本町 総合研究7号館 412号室
Email: kazuyoshi.yoshii@riken.jp