0 アイカツシリーズのセリフから使用件数を返す

アイカツ! Advent Calendar 2020 - Adventar 4日目

前回(スクレイパ失敗した - mimemo)の続き
web driverを使って再試行

アイカツ!(無印)以外の作品を対象から外す

これは前回できてたのでそのままのセレクタを利用

Lazy Load をどうにかする

これを克服するためにSeleniumを使った
結果を出すElementの高さ scrollHeight 分をtime.sleep(__n__) 入れてスクロールする事で対応した

ダメだったやつ
  • driver.implicitly_wait(20) みたいなヤツ
    効いてるのかすら不明,結局 time.sleep() 使ったけどページによってはこれも効かないみたい
  • WebDriverWaitbodyタグ出たらおkみたいなヤツ
    おkな訳がない
    body出ただけだとテンプレ状態になってるページが多い {{__naiyo__}} みたいな
    ターゲットを内包しているタグ表示まで待たせるのが良い

できたモノ

スクリーンショット 2020-12-04 16.21.08

通常ページ

スクリーンショット 2020-12-04 16.15.06

スクリーンショット 2020-12-04 16.13.48

スクリーンショット 2020-12-04 16.14.23

* おだやかじゃない:「穏やかじゃない」でもヒットします(読みでヒットする)
* おだやかじゃない,ライジングの件数相違:件数が違うのは他作品がヒットしているため,このスクリプトではアイカツ!(無印シリーズ)だけを摘出してカウントしています

当初のやりたいことが無事できました
今後,続きやるなら,話数リストで出すとか黒い画面以外から実行するヤツとかやってみたいですね

めろんごはん

0

メモを他の人に見せる

このメモを見せたい人に、このURL(今開いているページのURLです)を教えてあげてください

コメント(0)

  • someone

  • someone