コンピュータはどこまで賢くなれるのか?
機械学習の理論構築,アルゴリズム開発,実世界応用
情報通信技術の飛躍的な発展に伴い、推論や創造など人間にしかできないと思われていた知的な活動が、コンピュータによって実現できるようになってきました。杉山研究室では、「コンピュータはどこまで賢くなれるのか」をテーマに、人工知能分野の機械学習とよばれる知的情報処理技術に関する研究を行っています。
- 学習理論の構築
汎化とは、学習していない未知の状況に対応できる能力であり、コンピュータが知的に振る舞うために不可欠です。本研究室では、確率論や統計学などに基づいて、コンピュータが汎化能力を獲得できるメカニズムを数理的に探求しています。
- 学習アルゴリズムの開発
機械学習には、入出力が対になったデータから推論する教師付き学習、入力のみのデータから学習する教師なし学習、環境との相互作用を通して長期的な意思決定を最適化する強化学習など、様々な課題があります。本研究室では、理論的な裏付けを持ちつつ、実用性の高い機械学習アルゴリズムを開発しています。
- 機械学習技術の実世界応用
人工知能技術の発展と普及に伴い、文書、音声、画像、動画、行動、経済などの実世界データや、物理、化学、生命、医学、天体、ロボットなどの実験観測データが大量に収集されるようになってきました。本研究室では国内外の企業や研究所と連携し、最先端の機械学習アルゴリズムを駆使した実課題解決に挑戦しています。
計算で見る見えない世界
人の知覚を超えるセンシングとスケールで実世界を捉える
横矢研究室では,複雑な実世界の状況を理解するための視覚情報処理技術の研究に取り組んでいます.当研究室はコンピュータビジョンとリモートセンシングの融合領域に位置し,多様なスケールとモダリティにわたって,人間の知覚を超えることを目指した計算イメージングとシーン理解を行っています.
- 計算イメージングと逆問題
センシングと計算を統合することで,解像度,ノイズ,遮蔽といったハードウェアの限界を克服することを目指しています.最適化,信号処理,機械学習に基づく数理モデルとアルゴリズムを開発し,不完全かつノイズを含む観測データから元のシーンや信号を復元する研究に取り組んでいます.高次元かつマルチモーダルな画像の再構成や高精細化といった,困難な逆問題にも挑戦しています.
- シーン理解とマルチモーダル融合
複雑な実世界環境を理解するために,意味的・幾何的構造の再構成,デジタルツインの生成,インタラクティブなシーン解釈に取り組んでいます.これには,衛星,ドローン,地上センサなどのマルチプラットフォームで取得された光学,熱,レーダ,LiDARデータの統合が含まれます.また,汎用的かつ対話的なシーン理解を実現するため,視覚言語モデルの活用にも取り組んでいます.さらに,学習データの制約に対応するため,自己教師あり学習,合成データ,シミュレーションを活用した効率的な学習手法の研究も行っています.
- リモートセンシング画像解析
リモートセンシングは,人が立ち入ることが困難な自然環境から密集した都市部まで,広域な観測を可能にします.都市構造,森林バイオマス,農地の分布,災害による被害といった地理空間的な特徴をマッピング・モニタリングするためのアルゴリズムを開発しています.OpenEarthMapプロジェクトを通じて,マッピング性能における地理的な公平性の実現を目指し,オープンデータセットの構築と,資源効率の高いアルゴリズムの開発に取り組んでいます.
実用的で信頼性の高い機械学習技術の確立へ
石田研究室は2021年度にスタートし,現在は機械学習のアルゴリズムを開発するという基礎研究を進めています.未知なるデータに対する汎化性能を高める研究や,弱い教師情報しか与えられていない場合でも高精度に学習する手法の研究などに取り組んでいます.その他にも様々な観点から,より実用的で信頼性の高い機械学習技術の確立を目指しています.
- 弱教師あり学習に関する研究
通常の教師あり学習では事前にラベル付きデータを数多く収集する必要がありますが,正しいラベルを付与する際に多くのラベル付けコストがかかります.また,適切な教師情報を資金以外の制約により収集できないケースもあります.そこで,補ラベル学習や正信頼度学習など,様々な弱い教師情報からでも学習できるようにするための研究を進めています.
- 過適合や正則化技術に関する研究
少数のデータしか集まらない場合や,教師ラベルに雑音が加わるような状況では,過適合などにより高い予測性能を発揮することが難しくなります.そこで,様々な環境下でも精度の劣化を回避しながらロバストに学習するための研究を行っています.
- 機械学習モデルやデータの評価に関する研究
訓練した機械学習モデルにどれほどの改善余地が残されているのかを知ることは,実応用の際に重要です.限界性能を推定することができれば,訓練したモデルの性能と比較することで改善余地を把握することに役立ちます.また,限界性能は取り組んでいるタスクやデータセットの難易度としても活用できます.そこで,限界性能の推定をはじめ,モデルやデータセットを評価するための技術を開発しています.