週報_BEVFormer(QI)

BEVFormer:Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

Learning the BEVFormer algorithm which based on VPN and LSS. 

Cross-view Semantic Segmentation for Sensing Surroundings 

Lift, Splat, Shoot: Encoding Images From Arbitrary Camera Rigs by Implicitly Unprojecting to 3D

The output multi-scale features from FPN with sizes of 1/16, 1/32, 1/64 and the dimension of C = 256 . For experiments on nuScenes, the default size of BEV queries is 200×200, the perception ranges are [51.2m, 51.2m] for the X and Y axis and the size of resolution s of BEV’s grid is 0.512m.

 BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers 

BEVFormer-中文版.pdf

週報(鄭)

日本語能力試験N1を受けました。

インターンに落ちたので、SPIの点数が低かったことが原因だと思います。今からSPIや玉手箱の練習をしたいと思います。

また、面接のことを少し心配しているので、冬のインターンまでに話すことをもっと練習したいと思います。

週報(中本)

SONYの適性検査を受けましたが、あまりできませんでした。
スマプロはエラーが直せなかったので、環境を作り直して0からやり直してみようと思います。
先週は進捗があまり出せませんでした。

今週はSONYの面接を受けて、本格的にスマプロに取り掛かりたいです。

Stay Hungry, Stay Foolish!