Arano Kazuyuki のすべての投稿

今週の進捗(新野)

使用デバイス: cuda:0
-----start-------
Epoch 1/14 | train | Loss: 0.5769 Acc: 0.6843
Epoch 1/14 | val | Loss: 0.4572 Acc: 0.8090
Epoch 2/14 | train | Loss: 0.3569 Acc: 0.8503
Epoch 2/14 | val | Loss: 0.4530 Acc: 0.8256
Epoch 3/14 … Continue Reading ››

今週の進捗(新野)

  • GiNZAでの係り受け解析の後のトークンから「名詞修飾語」、「主語名詞」にあたる関係を一つの文節として結合した。

【元の文節】
'左が',
'頻繁に、',
'右も',
'時々',
'音が',
'途切れて',
'聴きづらく',
'なります。',
'音の',
'バランスも',
'左右差が',
'あるような…',
'立ち上げ直したり、',
'Bluetoothを',
'繋ぎ直しても',
'変わらず…',
'コードが',
'ないのは',
'すごく',
'便利だし、',
'使い勝手は', 'いいのですが、',
'残念です(>_<)'
【処理後文節】
'左が頻繁に、',
'右も',
'時々',
'音が途切れて',
'聴きづらく',
'なります。',
'音のバランスも',
'左右差があるような…',
'立ち上げ直したり、',
'Bluetoothを',
'繋ぎ直しても',
'変わらず…',
'コードがないのは',
'すごく',
'便利だし、',
'使い勝手はいいのですが、',
'残念です(>_<)'

係り受け処理精度に不安を感じるので、GiNZAにユーザー辞書を追加するか、Transformerを転移学習させるか考えています。

詳しくはゼミで話します。

今週の進捗(新野)

  • 楽天市場のWEBサイトからレビューデータの収集(カテゴリー:化粧水、洗顔フォーム、PC本体、イヤホン、洗剤+柔軟剤): 2,265 reviews
  • レビューを文節で分割(GiNZAを使用)https://ailog.site/2021/10/16/2021/1016/ ➡レビュー内の文章はカジュアルに書かれていることがあるので精度に少し不安感。

例)「左が頻繁に、右も時々音が途切れて聴きづらくなります。音のバランスも左右差があるような…立ち上げ直したり、Bluetoothを繋ぎ直しても変わらず…コードがないのはすごく便利だし、使い勝手はいいのですが、残念です(>_<)」

【文節分割結果】
左が
頻繁に、
右も
時々
音が
途切れて
聴きづらく
なります。
音の
バランスも
左右差が
あるような…
立ち上げ直したり、
Bluetoothを
繋ぎ直しても
変わらず…
コードが
ないのは
すごく
便利だし、
使い勝手は
いいのですが、
残念です(>_<)
【文節係り受け解析結果】
左が → 頻繁に、
時々 → 途切れて
音が → 途切れて
頻繁に、 → 聴きづらく
右も → 聴きづらく
途切れて → 聴きづらく
聴きづらく → なります。
音の → バランスも
バランスも → あるような…
左右差が → あるような…
立ち上げ直したり、 → 繋ぎ直しても
Bluetoothを → 繋ぎ直しても
繋ぎ直しても → 変わらず…
変わらず… → ないのは
コードが → ないのは
ないのは … Continue Reading ››

Stay Hungry, Stay Foolish!