今回は、Pythonのopenpyxlについて学びます。
Excelスプレッドシートは、人生のある段階において対処しなければならない多くのもののうちの1つです。
上司が好むから、あるいはマーケティング担当者が必要とするから、スプレッドシートの扱い方を学ぶ必要があるかもしれませんが、そこで openpyxl
を学ぶことが役に立ちます。
Openpyxlを使用して、スプレッドシートを読み、各行を循環させ、データベースからデータを取得し、そしてスプレッドシートに書き戻すことができます。
基本的な用語の理解
このモジュールで作業を始める前に、以下の表で言及されている基本的な定義を理解しましょう。
用語|定義|ワークブック | |
ワークブック:私たちが作業しているメインファイル。 | |
ワークシート|ワークブック全体の各個別シート。 | |
列|A、B、C、Dなどのようにラベル付けされた縦線。 | |
行|1,2,3,4,5と書かれた水平線。 | |
セル:A1,A2,A3などの行と列の組み合わせ。 |
いくつかの基本的な用語と定義
Openpyxlモジュール入門
PythonのOpenpyxlモジュールは、サードパーティのMicrosoftアプリケーションソフトを必要とせずにExcelファイルを操作するために使用されます。
このモジュールを利用することで、アプリケーションを起動することなく、Excelを操作することができます。
例えば、Excelファイルからのデータの読み込み、Excelファイルへのデータの書き込み、グラフの描画、Excelシートへのアクセス、シート名の変更、シートの修正(追加と削除)、フォーマット、シートのスタイル設定、その他あらゆる作業を実行するために使用されます。
Openpyxlは、これらのジョブを処理するための非常に効率的なツールです。
データサイエンティストは、データのコピー、データマイニング、データ分析などの様々な作業を実行するためにOpenpyxlを頻繁に利用します。
PythonによるOpenpyxlのインストール
Openpyxlを使用するには、Python 3.7とopenpyxl 2.6.2がマシンにインストールされている必要があります。
さっそく、以下のコマンドでopenpyxlをインストールしてみましょう。
pip install openpyxl |
Pythonでopenpyxlを操作する
さっそくPythonのopenpyxlライブラリの操作に入りましょう。
このライブラリを実装して、Excelファイルを読み込む準備をします。
さっそく始めてみましょう。
1. 作成と値の割り当て
まず、workbook 関数を使用して新しいワークブックを作成します。
ワークブックには、必ず1枚以上のシートが含まれます。
1
2
|
from openpyxl import Workbook
wb = Workbook()
|
アクティブシートの位置を取得し、アクティブシートのセルに任意の値を与える。
1
2
3
4
|
sheet = wb.active
sheet[ 'A1' ] = 67847 sheet[ 'A2' ] = 'Python!'
sheet[ 'A3' ] = 8908.983
|
最後に、save()関数を使って、すべてのデータを「sample_tica.xlsx」ファイルに格納します。
最終的なエクセルファイルは下の画像のようなものになります。
1
2
3
4
|
data = (( 7434 , 675 , 5433 ), ( "Python" , 'Awesome!' , 452.8763 ) )
for i in data:
sheet.append(i)
wb.save( "sample_file.xlsx" )
|
3. ファイルへのデータ追加
Openpyxlのappend()関数は、データ群を追加するために使用されます。
どんな種類の値でも追加することができます。
これらの値は、現在の作業シートの最下部に追加されます。
修正されたExcelシートはこのようになります。
まとめ
これでPythonでスプレッドシートを使う方法を理解できましたね。
チュートリアルはいかがでしたか?いずれにせよ、以下のチュートリアルを見てみることをお勧めします。
- PandasのDataFrameをExcelファイルに変換する方法
- Pythonを使ってExcelシートからデータをプロットする
- PySparkを使ったデータの印刷 – 完全ガイド
お時間を割いていただきありがとうございました! 何か新しいことを学べたでしょうか!