--- Title: アイカツシリーズのセリフから使用件数を返す Author: aikatsu Web: 'https://mimemo.io/m/xBM60G5MA5GgnXD' --- ### [アイカツ! Advent Calendar 2020 - Adventar](https://adventar.org/calendars/5701) 4日目 前回([スクレイパ失敗した - mimemo](https://mimemo.io/m/zeXgworkyJlK0Ek))の続き web driverを使って再試行 #### アイカツ!(無印)以外の作品を対象から外す これは前回できてたのでそのままのセレクタを利用 #### Lazy Load をどうにかする これを克服するためにSeleniumを使った 結果を出すElementの高さ `scrollHeight` 分を`time.sleep(__n__)` 入れてスクロールする事で対応した ##### ダメだったやつ - `driver.implicitly_wait(20)` みたいなヤツ 効いてるのかすら不明,結局 `time.sleep()` 使ったけどページによってはこれも効かないみたい - `WebDriverWait`で`body`タグ出たらおkみたいなヤツ おkな訳がない body出ただけだとテンプレ状態になってるページが多い `{{__naiyo__}}` みたいな ターゲットを内包しているタグ表示まで待たせるのが良い #### できたモノ ![スクリーンショット 2020-12-04 16.21.08](https://mimemo.s3-ap-northeast-1.amazonaws.com/attachment/12af108c-4375-4263-a0ad-ad5e1f672ce9.png) #### 通常ページ ![スクリーンショット 2020-12-04 16.15.06](https://mimemo.s3-ap-northeast-1.amazonaws.com/attachment/a4a62cd8-ea81-4633-8e37-05f618394233.png) ![スクリーンショット 2020-12-04 16.13.48](https://mimemo.s3-ap-northeast-1.amazonaws.com/attachment/519914d6-b6da-40c4-9933-42634903e1bf.png) ![スクリーンショット 2020-12-04 16.14.23](https://mimemo.s3-ap-northeast-1.amazonaws.com/attachment/b2957f77-a730-4494-b48f-c05ad93f513b.png) \* おだやかじゃない:「穏やかじゃない」でもヒットします(読みでヒットする) \* おだやかじゃない,ライジングの件数相違:件数が違うのは他作品がヒットしているため,このスクリプトではアイカツ!(無印シリーズ)だけを摘出してカウントしています 当初のやりたいことが無事できました 今後,続きやるなら,話数リストで出すとか黒い画面以外から実行するヤツとかやってみたいですね [めろんごはん](https://twitter.com/mellon_gohan)