今週の進捗(仮屋)

進捗

  • デザインパターンの学習(オブジェクト指向で再利用性の高いコーディング方法の学習)
  • レイアウト解析については進捗なし。まずは名刺読み取りなどに使われている方法を模倣しようと思うが、アルゴリズムに関する記事があまり見当たらない。仮に機械学習や深層学習であった場合、学習データを集めるのが難しい可能性あり。

予定

  • デザインパターンの学習
  • レイアウト解析の調査 深層学習なども学習するべき?
  • 学会論文作成-提案マッチング手法を組み込んだ文字認識アプリケーションの実装

覚書

名刺解析:文字列検出→文字認識→クラス分け(社名・個人名・役職...)

注文書の解析においては、整数の分類(価格と個数の識別)が難しそう。座標値の位置関係も学習させる必要あり?