五十君 良寿 のすべての投稿

今週の進捗(五十君)

今週の進捗

・ウェブスクレイピングを利用したシステムとは別で、楽天のAPIを利用したシステムを制作した。

・新たなシステム(上記のシステム)を作ったため、卒論にそのシステムについて書き加えた。現在、6章構成中の3章まで(序論、提案手法、原理)書き終えている。

今後の予定

・まずは発表用のパワーポイントを作る。

・パワーポイントが終わり次第、実験をして卒論に結果を書く。

今週の進捗(五十君)

卒論タイトル「買い物リストの曖昧さに対応した買い忘れ防止システムの提案」

今週の進捗

・卒論(全6章構成の予定)の2章「提案手法」、3章「原理」の部分を書いた。

研究相談

実験における商品名の入力について迷っています。

・店舗数を絞るべきか、増やすべきか

色々な店舗のレシートはたくさん持っているので、色々な店舗のレシートに記載された商品名を使って実験するのか、それとも、店舗を絞ってからそこのレシートに記載された商品名を使って実験するのかを迷っています。

・商品名の取り扱い

システムにおいて、レシートに記載された商品名をそのままの名前で入力するか、余計な部分を取り除いてから入力するかを迷っています。

今週の進捗(五十君)

今週の進捗

・大ゼミ発表

・卒論の序論部分を作成した

研究相談

前回の大ゼミで、卒論のタイトルを「ウェブスクレイピングを用いた買い忘れ防止案」と発表したのですが、「ウェブスクレイピングは目的のための1つの手段に過ぎない」とのご指摘を頂いたので、新しくタイトルを考え直し、

「ジャンルのマッチングによる買い忘れ防止システムの提案」

というタイトルにしたいと考えたのですが、何か変更した方が良い点などがありましたらぜひ教えてください。

今週の進捗(五十君)

テーマ「文字認識を用いた買い忘れ防止案」

今週の進捗

「買った商品名」と「欲しい商品のジャンル名(例:コシヒカリ⇒米)」を複数入れると、Webスクレイピングによって楽天市場から「買った商品のジャンル名」を取得し、「欲しい商品のジャンル名」と「買った商品のジャンル名」をマッチングさせるプログラムを完成させた。

今後の課題

現在は、大きなジャンルとして楽天市場の「食品」ジャンルの中で、買った商品名を検索するプログラムとなっており、飲み物については何も考慮されてない状態なので、飲み物についても上記のようなマッチングができるようにする。

今週の進捗(五十君)

テーマ「文字認識を用いた買い忘れ防止案」

今週の進捗

楽天市場で商品を検索した際に表示される、その検索した商品に関係のあるカテゴリ名をウェブスクレイピングにより取得するプログラムを書き、カテゴリー名の取得に成功した。

今後の課題

現在は、欲しいカテゴリー名を1つ、買った商品名を1つ用意してプログラムを試しているのですが、1つずつだと大体うまくいったので、今後はこれらを配列にしてプログラムを試していく。

今週の進捗(五十君)

テーマ「文字認識を用いた買い忘れ防止案」

Theme「Prevention Plan of Forgetting to Buy with Character Recognition」

または

テーマ「Webスクレイピングを用いた買い忘れ防止案」

Theme「Prevention Plan of Forgetting to Buy with Web Scraping」

今週の進捗

fasttextを用いてモデルを作成し、そのモデルを基にテキスト分類を試してみた。

検証結果①

米:15種類、牛乳:15種類、パン:15種類の単語の学習モデルを使用。

結果:学習させた単語でテキスト分類にかけるとパンと牛乳については、大体は正解のラベルを返してくるが、学習させた米の単語をテキスト分類にかけても、パンや牛乳のラベルを返してくることが多かった。

今週の進捗(五十君)

テーマ「文字認識を用いた買い忘れ防止案」

今週の進捗

①fasttext用の学習データを、まずは、お米・牛乳・パンの3種類で作成した。

②Amazon APIを使う方法も先週は考えていたが、調べてみるとこれには厳しい審査を通る必要があるのでこちらは辞めようと思った。fasttextの方に専念する。

今後の課題

・fasttextはインストールできていたのだが、python用のfasttextモジュールはインストールできていなかったことが分かり、そのせいで作成した学習データをfasttextに学習させることができなかった。そして、fasttextの公式のページhttps://fasttext.cc/docs/en/support.html

これに書いてある通りに、fasttextモジュールを入れても、pyファイルを実行すると「そのモジュールはありません」と表示されるので、これの対応を考える。