1/14から2/2にかけて富士フイルムのインターンシップに参加した。
内容は、研究開発(インフォマティクス:化学系)の実務体験で、深層学習と画像処理を掛け合わせた開発を行った。
言語はPython、ライブラリはKerasを使用して、3種類のCNNアーキテクチャ(AlexNet、VGG16、LeNet)を構築し、モデルの訓練および評価を行った。
評価では、畳み込みの出力層を取り出して、特徴強度をヒートマップで表した。この技術は、今後の研究でも有用だと考える。
1/14から2/2にかけて富士フイルムのインターンシップに参加した。
内容は、研究開発(インフォマティクス:化学系)の実務体験で、深層学習と画像処理を掛け合わせた開発を行った。
言語はPython、ライブラリはKerasを使用して、3種類のCNNアーキテクチャ(AlexNet、VGG16、LeNet)を構築し、モデルの訓練および評価を行った。
評価では、畳み込みの出力層を取り出して、特徴強度をヒートマップで表した。この技術は、今後の研究でも有用だと考える。
文字列をタッチしたら文字認識を行えるように修正中。
アプリの構成をどうするか検討中。
現在の案では射影変換→輪郭選択→文字列選択→文字認識(マッチング)