このチュートリアルの目的は、Selenium を紹介し、ブラウザの自動化のために selenium と webdriver をインストールする手順を示すことです。
この記事では、すでにあなたのマシンに python がインストールされていることを前提にしています。
ブラウザの自動化とWeb Scrappingは完全にホワイトハットのアプローチであり、Webブラウザ自体がそれを公式にサポートし、自動化とテストのためのWebドライバを提供し、コードを使用して開いたブラウザウィンドウが “このブラウザは自動テストソフトウェアによって制御されています “とラベル付けされていることに注意することが重要なポイントになります。
この記事もチェック:Seleniumのブラウザドライバ入門
セレンとは?
Selenium は、Web ブラウザを自動化するためのさまざまなツールを提供するオープンソースのプロジェクトです。
また、Web ページから目的のデータを取得(スクレイピング)するための Web スクレイパーを作成するためにも使用されます。
Python Seleniumを使用して実行できるタスクには次のようなものがあります。
- ログイン、会議参加、スクロール、サーフィンなどのブラウザのタスクを自動化します。
- Webサイト/Webページからテキスト、Excelファイル、コードなどのデータを取得します。
ブラウザの自動化で重要なコンポーネントは、Webdriverです。
Webdriverは、ブラウザとの対話を容易にするAPIのコレクションです。
SeleniumとWebdriverを組み合わせることで、Webの退屈なタスクを非常に簡単に自動化できます。
この記事もチェック:PythoのSeleniumを使用して要素を取得する色々な方法を解説する
Seleniumのインストール
ブラウザの自動化とWebスクレイピングのためにコンピュータをセットアップすることから始めるために、いくつかのツールとライブラリのインストールから始める必要があります。
1. Seleniumのインストール
まず、selenium パッケージを pip でインストールします。
pip install package_name コマンドを使用すると、任意の Python パッケージを簡単にインストールできます。
パソコンのコマンドプロンプトを開き、以下のコマンドを入力します。
システムや IDE のターミナルから実行することもできます。
pip install selenium |
これで、最新版のseleniumがインストールされます。
2. Selenium Webdriver をインストールする
セットアップの2番目のタスクは、自動化するために使用するブラウザに応じて、Webdriverをインストールすることです。
Webdriver をインストールするとき、Web ブラウザと同じバージョンであることを確認する必要があります。
各ブラウザは、親会社によって管理されている独自のウェブドライバを持っています。
以下は、一般的なWebブラウザであるMozilla Firefox、Google Chrome、Microsoft EdgeのWebdriverをそれぞれダウンロードするためのリンクです。
Mozilla FirefoxのWebdriverをダウンロードするには:こちら
Google Chrome Webdriverのダウンロードはこちら
Microsoft Webdriverのダウンロードはこちら
seleniumと必要なWebdriverをダウンロードしたら、Webブラウザを自動化するためのPythonスクリプトを書く準備は完了です。
3. Python で Selenium をインポートする
必要なツールやライブラリをダウンロードしたので、最後のステップとして、以下のように必要なものをインポートする必要があります。
注:インストールされたWebドライバファイルの場所(コンピュータに保存されているもの)をwebdriverメソッドに渡す必要があります。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome( 'C://software/chromedriver.exe' )
|
ヒント: すべてのコードで毎回パラメータとして場所を渡す代わりに、ダウンロードしたウェブドライバファイルの場所を環境変数として宣言(保存)することで、このステップをスマートに省略することができます。
セレンに関するおすすめの本
最後に、Python Seleniumのチュートリアルに沿って、WebスクレイピングとWebブラウザーのタスクの自動化を開始することができます。
- Python Seleniumを使ってWebページのURLを開く
- ウェブページからデータを取得する
- Seleniumを使用して株式市場のデータを取得する