0 アイカツシリーズのセリフから使用件数を返す
アイカツ! Advent Calendar 2020 - Adventar 4日目
前回(スクレイパ失敗した - mimemo)の続き
web driverを使って再試行
アイカツ!(無印)以外の作品を対象から外す
これは前回できてたのでそのままのセレクタを利用
Lazy Load をどうにかする
これを克服するためにSeleniumを使った
結果を出すElementの高さ scrollHeight
分をtime.sleep(__n__)
入れてスクロールする事で対応した
ダメだったやつ
driver.implicitly_wait(20)
みたいなヤツ
効いてるのかすら不明,結局time.sleep()
使ったけどページによってはこれも効かないみたいWebDriverWait
でbody
タグ出たらおkみたいなヤツ
おkな訳がない
body出ただけだとテンプレ状態になってるページが多い{{__naiyo__}}
みたいな
ターゲットを内包しているタグ表示まで待たせるのが良い
できたモノ
通常ページ
* おだやかじゃない:「穏やかじゃない」でもヒットします(読みでヒットする)
* おだやかじゃない,ライジングの件数相違:件数が違うのは他作品がヒットしているため,このスクリプトではアイカツ!(無印シリーズ)だけを摘出してカウントしています
当初のやりたいことが無事できました
今後,続きやるなら,話数リストで出すとか黒い画面以外から実行するヤツとかやってみたいですね
コメント(0)