当サイトは、Javascriptを使用しています。Javascriptを無効にして閲覧した場合、コンテンツが正常に動作しないおそれやページが表示されない場合があります。当サイトをご利用の際には、Javascriptを有効にして閲覧下さい。

革新知能統合研究センター深層学習理論チーム

チームディレクター鈴木大慈（Ph.D.）

English Page

研究概要

深層学習を含む様々な学習機構について理論的側面から研究を進めています。より少ないデータでより精度良く学習するにはどうすればよいか。学習理論を通じて各種学習手法の汎化性能や学習アルゴリズムの収束性能を解明し複雑な学習過程の本質への理解を深め、さらに理論をもとに新しい機械学習手法の構築や応用への還元を行っています。特に、機械学習では高次元かつ複雑なデータを用いた学習が要求されますが、それを解決する方法として深層学習や構造的スパース推定の方法論を研究しています。また、確率的最適化などの方法により大規模かつ複雑な機械学習問題を効率的に解く手法の開発も行っています。

研究テーマ:

深層学習を含む広い学習機構の統計的学習理論
大規模データにおける効率的最適化アルゴリズム
高次元統計学

研究主分野

情報学

研究関連分野

数物系科学
情報学基礎/数理情報学
情報学基礎/統計科学

キーワード

深層学習
統計的学習理論
機械学習
確率的最適化
数理統計

主要論文

1. Juno Kim, Taiji Suzuki.:
"Transformers Learn Nonlinear Features In Context: Nonconvex Mean-field Dynamics on the Attention Landscape. Forty-first International Conference on Machine Learning (ICML2024),"
Proceedings of Machine Learning Research, 235:24527--24561, (2024)
2. Kazusato Oko, Shunta Akiyama, Denny Wu, Tomoya Murata, Taiji Suzuki.:
"SILVER: Single-loop variance reduction and application to federated learning. Forty-first International Conference on Machine Learning" (ICML2024)
Proceedings of Machine Learning Research,　235:38683--38739, (2024)
3. Taiji Suzuki, Denny Wu, Atsushi Nitanda.:
"Convergence of mean-fieldLangevin dynamics: Time and space discretization, stochastic gradient,and variance reduction."
Thirty-seventh Conference on NeuralInformation Processing Systems (NeurIPS2023), pp. 15545--15577,(2023)
4. Taiji Suzuki, Denny Wu, Kazusato Oko, Atsushi Nitanda.:
"Feature learning via mean-field Langevin dynamics: classifying sparse parities and beyond."
Thirty-seventh Conference on Neural Information Processing Systems (NeurIPS2023), pp. 34536--34556,(2023)
5. Kazusato Oko, Shunta Akiyama, Taiji Suzuki.:
"Diffusion Models are Minimax Optimal Distribution Estimators. Proceedings of the 40th International Conference on Machine Learning (ICML2023)"
Proceedings of Machine Learning Research, 202:26517--26582,(2023)
6. Shokichi Takakura, Taiji Suzuki.:
"Approximation and Estimation Ability of Transformers for Sequence-to-Sequence Functions with Infinite Dimensional Input. Proceedings of the 40th International Conference on Machine Learning (ICML2023)"
Proceedings of Machine Learning Research, 202:33416--33447, (2023)
7. Atsushi Nitanda, Denny Wu, Taiji Suzuki.:
"Convex Analysis of the Mean Field Langevin Dynamics. 25th International Conference on Artificial Intelligence and Statistics (AISTATS2022)"
Proceedings of Machine Learning Research, 151:9741--9757,(2022)
8. Atsushi Nitanda, and Taiji Suzuki.:
"Optimal Rates for Averaged Stochastic Gradient Descent under Neural Tangent Kernel Regime."
ICLR2021 (ICLR2021 outstanding paper award).
9. Taiji Suzuki, Hiroshi Abe, Tomoya Murata, Shingo Horiuchi, Kotaro Ito, Tokuma Wachi, So Hirai, Masatoshi Yukishima, Tomoaki Nishimura.:
"Spectral pruning: Compressing deep neural networks via spectral analysis and its generalization error"
The 29th International Joint Conference on Artificial Intelligence and the 17th Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI 2020)
10. Taiji Suzuki, Hiroshi Abe, Tomoaki Nishimura.:
"Compression based bound for non-compressed network: unified generalization error analysis of large compressible deep neural network"
The 8th International Conference on Learning Representations (ICLR 2020)

メンバーリスト

主宰者

鈴木大慈: チームディレクター

メンバー

園田翔: 上級研究員
HUANG Wei: 研究員
MASSAROLI Stefano: 特別研究員
若山智哉: 特別研究員
金森敬文: 客員研究員
竹之内高志: 客員研究員
藤澤洋徳: 客員研究員
赤穂昭太郎: 客員研究員
川島孝行: 客員研究員
和田裕一郎: 客員研究員
村田昇: 客員研究員
村田智也: 客員研究員
大古一聡: 研修生
VIELZEUF Charles Freddy Pierre-Louis: 研修生
LI Bingrui: 研修生
CHEN Zonghao: 研修生
ZHOU Zhanpeng: 研修生
BU Dake: 実習生
髙梨耕作: 研究パートタイマーⅠ
西川直輝: 研究パートタイマーⅠ
川田遼太郎: 研究パートタイマーⅡ
樋口嶺: 研究パートタイマーⅡ
桒高健人: 研究パートタイマーⅡ
JIANG Haoxiang: 研究パートタイマーⅡ

お問い合わせ先

東京都文京区本郷 7-3-1
東京大学大学院情報理工学系研究科数理情報学専攻
Email: taiji.suzuki@riken.jp

革新知能統合研究センター 深層学習理論チーム