- 論文完成
- 発表資料作成
Arano Kazuyuki のすべての投稿
今週の進捗(新野)
論文執筆!
今週の進捗(新野)
- 張先生が大ゼミで言ったモデル自体の有用性について少し手を加えました。有用性の高いレビューのみを集めたデータセットと有用性の低いもののみを集めたデータセットを抽出器にかけると、有用性の高いと判断されたレビューの割合が前者は全体の7割程度、後者は3割程度でした。ある程度の差が確認できたのでこれで大丈夫かと思います。これで研究を終えようと思います。
- 論文を書こうにもTexの設定がうまくいかなくて、一旦Wordに原稿を書いています。
今種の進捗(新野)
- 大ゼミ発表準備
- 卒論執筆
- 有用性の高いレビュー抽出器の適合率が7割と、少しだけ上がりました。
今週の進捗(新野)
- 論文執筆(背景、原理)
- 最終的な落としどころを、レビュー群から評価値の高いレビューと低いレビューを分類するモデルの作成、にしたいと思います。しかし、精度が65%と低いので、論文執筆を優先しながら同時進行で多少の精度を行うつもりです。→でも多分厳しいと思います…
来年用の物件探しのため、1/11の大ゼミと張研ゼミは欠席します。
今週の進捗(新野)
- 仮説1: ポジティブ、ネガティブが同程度
- 仮説2: ニュートラルが最大
- 仮説3: まとまりがある
- 最終的な仮説1〜3をk-近傍方で検証しました。(この仮説を元に参考になるレビューか否かを分類)➡︎結果として、仮説1〜3のどれも分類精度が65%前後でした。
方向性としてはこのような感じで終わろうと思ってますが、理解のしやすさと精度の低さから、少し変更点を入れるか悩み中です。
今週の進捗(新野)
- 文章のネガポジ判定に関して、自作のモデルは精度が低かったので、すでにある学習済みモデルをファインチューニングして使うことにしました。➡「ポジティブ」⇔「ネガティブ」の誤判定は少ないのですが、「ポジティブ」⇔「ニュートラル」、「ネガティブ」⇔「ニュートラル」の誤判定が多少ありました。
仮説検証用のレビューデータが集まってきたので、実際に検証してみたいと思います。
今週の進捗(新野)
- 自作のモデルの精度が低いので、学習済みモデルをファインチューニングしようとしたが、colabではメモリが足りなかった。→研究室のGPUで学習回そうと思う。
- 最終的な仮説の検証用のデータ集め
今週の進捗(新野)
- 以前張先生が言ったようにepoc数を変えて学習させましたが、やはり当初のままの14辺りが最も損失が少なかったです。
- 大ゼミにて芹川先生と山脇先生に内容を理解して貰いにくかったので、伝え方を少し変える必要がありそうでした。
今週の進捗(新野)
- 大ゼミ用のスライド作成
- テーマ少し変えました。