DlibをraspberryPiにインストールした。これから動作確認を行う。
LED点灯について手をつけれていないので、回路を組んでみる。
DlibをraspberryPiにインストールした。これから動作確認を行う。
LED点灯について手をつけれていないので、回路を組んでみる。
修論をTexで書き始めた。また、修論と梗概をGitにプッシュした。これから毎週、Gitにプッシュしていく予定。
RasberryPiにTensorflowをインストールしたが、インポートできない。
おそらく様々なバージョンのPythonをインストールしたからだと思われる。
RasberryPiを再インストールしようとしたが行う事ができない。
USBを設定したからだと思われる。
現在RasberryPiが起動できない状態になっている。
先週の進捗
歩行者の再識別(ReID)-Deep learning person re-identification in PyTorch:
1. する対応する記事を読む:《Torchreid: A Library for Deep Learning Person Re-Identification in Pytorch》,《Omni-Scale Feature Learning for Person Re-Identification》,《Re-ranking Person Re-identification with k-reciprocal Encoding》..
2.先週始めたばかり,モデルトレーニングが完了し,合計時間かかります:11days,3:15:55,直後:Train and test a model:To train OSNet on Market1501
参加:庄司以外
井上:研究テーマを絞る。一つの課題に対し、論文を漁り、その研究の現状を知ることが大事です。
梶岡:顔のいろんな箇所に色差分、場所間差分を取り、飲酒の際の変化を顕著なデータを探る。ビデオデータを取得しておく。
金當:TOEICをもう一回挑戦しよう。研究について、時間を作って、試す。今週は画面輝度調節アプリを挑戦しましょう。
〇今週の進捗
右頬、左頬、白目の3か所を対象にBGRの変化を簡易的にではあるが取ってみた。今回はとりあえずどの色に着目するかを決めようと思ったのでフィルタ処理などはしていない。以下に結果のまとめがある。
〇考察
青、緑は変化がまちまちで参考にはならないかもしれない。やはりお酒を飲むと顔が赤らむのでそこに注目したほうがよさそう。
〇今後の課題
テーマ:機械学習を用いた読唇精度の向上
先週のゼミで指摘された通り、斎藤先生のプログラムの中身を調べたhttps://github.com/kyutech-saitoh/3D-CNN-for-Lip-Reading-Challenge2019 学習用データとテストデータのラベルはテキストファイルによって紐付けされていた。自分で少ないデータセットを用いてプログラムを書き換えて実行しようとしたが、1つのフォルダの中に発話シーンの画像が数十枚あり、そのフォルダごとに正解ラベルがあって挫折したので、斎藤先生のプログラムを活用したい。データセット(SSSDhttp://www.slab.ces.kyutech.ac.jp/SSSD/index_ja.html)に用いた画像は、Dlibを用いて唇を抽出しているみたい。
LipNet(https://github.com/rizkiarm/LipNet)の中身を知る前にgit cloneして動かせるか確認したが、pip install -e .
する際にgccが入ってないみたいなエラーが3件くらい出て検索したところXcodeを入れれば治ると書いてあったが、入れてみたところ変化なし。
画像からQRコードを検出、読み取りをできるようにしたが、画像の種類によっては読み込みができるときとできない場合があるので解決したい。動画からの検出ができるように今後は取り組みたい。
QRの検出はopencv4.0に組み込まれているもので画像を与えると処理してくれるので、どこか新規性を生み出す必要があるように思う。偏光版を用いたQRコードの作成は紙上に作成しようとしたところ、予想以上に黒く、偏光板を重ねることなく検出ができそうであり、また上記QR検出のプログラム作成で終えられなかった。