自己紹介 - 個人メモ用

学部での研究内容

自動運転環境下での単眼RGB画像に於ける物体の6D姿勢推定

簡単に言うと

「一枚のカメラ画像から物体の種類や位置や向いている方向を推定する研究」

このようなRGB画像を入力として、

1. 画像内の物体の種類

2. 各物体の三次元空間上での相対座標

3. 各物体の三次元空間上での回転角

を出力とする深層学習モデルの研究

現実世界での上記データのアノテーションは個人単位の研究では難しかった。

↓

Unityを用いて、物体のランダム配置や座標と回転角取得機能を実装して

カメラ画像と上記データのペアを3万枚生成して深層学習モデルを学習

深層学習モデルはAlexNetとResNetを使ったが、AlexNetの方が精度が高かった。

小規模な学会ですが、最優秀論文賞をいただくことができました。

医療・介護分野に於ける単眼RGB画像を用いた物体の6D姿勢推定

学部の研究とやっていることは同じ。

深層学習モデルは学部の研究で精度の高かった最古のCNNのAlexNetとEfficientNetV2-Mという最新のCNNモデルを利用。(近年話題のVision Transformerを利用しようとしたが、膨大な学習データが必要で、上手くいかなかった)

応用先

思った以上に興味のある部署に来ることができ、とてもワクワクしています。

お手を煩わせてしまうことも多いですが、よろしくお願いいたします！