当サイトは、Javascriptを使用しています。Javascriptを無効にして閲覧した場合、コンテンツが正常に動作しないおそれやページが表示されない場合があります。当サイトをご利用の際には、Javascriptを有効にして閲覧下さい。

革新知能統合研究センター音響情景理解チーム

チームディレクター吉井和佳（Ph.D.）

English Page

研究概要

音声・音楽・環境音など様々な音響信号を対象とした解析技術の研究を行っています。我々は、対象の性質をよく観察した上で、現実的な計算量で推論が実行できることを念頭に、できる限り物理的・理論的に妥当な確率的生成モデルを定式化し、その逆問題を解くアプローチをとっています。従来のベイズ学習に加えて、最近の深層学習の技術を取り入れることで、実世界の音響信号処理にチャレンジします。

研究テーマ：

統計的音響信号処理（音源分離/定位・音声強調など）
ベイズ学習（階層ベイズ・ノンパラメトリックベイズなど）
音楽情報処理（音源分離・自動採譜など）

研究主分野

コンピューター科学

研究関連分野

工学
数学

主要論文

1. Yoshiaki Sumura, Diego Di Carlo, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Joint Audio Source Localization and Separation　With Distributed Microphone Arrays Based on Spatially-Regularized Multichannel NMF."
IEEE International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 145-149, September 2024.
2. Liam Kelley, Diego Di Carlo, Aditya Arie Nugraha, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"RIR-in-a-Box: Estimating Room Acoustics from 3D Mesh Data through Shoebox Approximation."
Annual Conference of the International Speech Communication Association (Interspeech), pp. 3255–3259, September 2024.
3. Diego Di Carlo, Aditya Arie Nugraha, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Neural Steerer: Novel Steering Vector Synthesis with a Causal Neural Field over Frequency and Direction."
IEEE International Conference on Acoustics, Speech, and Signal Processing Workshops (ICASSPW), pp. 740–744, April 2024.
4. Aditya Arie Nugraha, Diego Di Carlo, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Time-Domain Audio Source Separation Based on Gaussian Processes with Deep Kernel Learning."
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), pp.1–5, October 2023.
5. Yoshiaki Bando, Yoshiki Masuyama, Aditya Arie Nugraha, Kazuyoshi Yoshii.:
"Neural Fast Full-Rank Spatial Covariance Analysis for Blind Source Separation."
European Signal Processing Conference (EUSIPCO),pp. 51–55, September 2023.
6. Kouhei Sekiguchi, Aditya Arie Nugraha, Yicheng Du, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Direction-Aware Adaptive Online Neural Speech Enhancement with an Augmented Reality Headset in Real Noisy Conversational Environments."
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), pp. 266–9273, October 2022.
7. Yicheng Du, Aditya Arie Nugraha, Kouhei Sekiguchi, Yoshiaki Bando, Mathieu Fontaine, Kazuyoshi Yoshii.:
"Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments."
Annual Conference of the International Speech Communication Association Interspeech), pp. 2918–2922, September 2022.
8. Aditya Arie Nugraha, Kouhei Sekiguchi, Mathieu Fontaine, Yoshiaki Bando, Kazuyoshi Yoshii.:
"DNN-Free Low-Latency Adaptive Speech Enhancement Based on Frame-Online Beamforming Powered by Block-Online FastMNMF."
IEEE International Workshop on Acoustic Signal Enhancement (IWAENC), pp. 1–5, September 2022.
9. Kouhei Sekiguchi, Yoshiaki Bando, Aditya Arie Nugraha, Mathieu Fontaine, Kazuyoshi Yoshii, Tatsuya Kawahara.:
"Autoregressive Moving Average Jointly-Diagonalizable Spatial Covariance Analysis for Joint Source Separation and Dereverberation."
IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 30, pp. 2368–2382, 2022.
10. Mathieu Fontaine, Kouhei Sekiguchi, Aditya Arie Nugraha, Yoshiaki Bando, Kazuyoshi Yoshii.:
"Generalized Fast Multichannel Nonnegative Matrix Factorization Based on Gaussian Scale Mixtures for Blind Source Separation."
IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 30, pp. 1734–1748, 2022.

メンバーリスト

主宰者

吉井和佳: チームディレクター

メンバー

NUGRAHA Aditya Arie: 研究員
DI CARLO Diego: 特別研究員
坂東宜昭: 客員研究員
下平英寿: 客員研究員
山田誠: 客員研究員
FONTAINE Mathieu Francois Gustave: 客員研究員
大山百々勢: 研究パートタイマーⅠ
小野稜介: 研究パートタイマーⅡ
二瓶竜乃介: 研究パートタイマーⅡ

お問い合わせ先

〒606-8501 京都市左京区吉田本町総合研究7号館 412号室
Email: kazuyoshi.yoshii@riken.jp

革新知能統合研究センター 音響情景理解チーム