Arano Kazuyuki のすべての投稿

今週の進捗(新野)

  • 張先生が大ゼミで言ったモデル自体の有用性について少し手を加えました。有用性の高いレビューのみを集めたデータセットと有用性の低いもののみを集めたデータセットを抽出器にかけると、有用性の高いと判断されたレビューの割合が前者は全体の7割程度、後者は3割程度でした。ある程度の差が確認できたのでこれで大丈夫かと思います。これで研究を終えようと思います。
  • 論文を書こうにもTexの設定がうまくいかなくて、一旦Wordに原稿を書いています。

今週の進捗(新野)

  • 論文執筆(背景、原理)
  • 最終的な落としどころを、レビュー群から評価値の高いレビューと低いレビューを分類するモデルの作成、にしたいと思います。しかし、精度が65%と低いので、論文執筆を優先しながら同時進行で多少の精度を行うつもりです。→でも多分厳しいと思います…

来年用の物件探しのため、1/11の大ゼミと張研ゼミは欠席します。

今週の進捗(新野)

  • 仮説1: ポジティブ、ネガティブが同程度
  • 仮説2: ニュートラルが最大
  • 仮説3: まとまりがある

  • 最終的な仮説1〜3をk-近傍方で検証しました。(この仮説を元に参考になるレビューか否かを分類)➡︎結果として、仮説1〜3のどれも分類精度が65%前後でした。

方向性としてはこのような感じで終わろうと思ってますが、理解のしやすさと精度の低さから、少し変更点を入れるか悩み中です。

今週の進捗(新野)

  • 文章のネガポジ判定に関して、自作のモデルは精度が低かったので、すでにある学習済みモデルをファインチューニングして使うことにしました。➡「ポジティブ」⇔「ネガティブ」の誤判定は少ないのですが、「ポジティブ」⇔「ニュートラル」、「ネガティブ」⇔「ニュートラル」の誤判定が多少ありました。

仮説検証用のレビューデータが集まってきたので、実際に検証してみたいと思います。