PythonでGUI自動化!pywinautoを使ったテキスト入力とボタン操作の基本

pywinautoとは?

pywinautoは、Pythonを使ってWindowsアプリケーションのGUI操作を自動化できる強力なライブラリです。マウスやキーボードの操作をスクリプト化することで、アプリケーションの操作を効率化し、手動操作を減らすことができます。

このライブラリは、以下のような幅広い用途で利用されています:

  • アプリケーションのテスト自動化
  • 繰り返しの多い作業の効率化

pywinautoは、内部的にWindowsのUIA(User Interface Automation)やWin32 APIを利用しており、アプリケーションのウィンドウやその内部のコントロール(ボタンやテキストボックスなど)をプログラムから操作することができます。

この記事で学べること

この記事では、pywinautoを使用して、以下の操作を実現する方法を学びます:

  • テキストボックスへの文字入力
  • ボタンを押して操作を実行

これらの操作は、Windowsアプリケーションの自動化を行う上での基本的なスキルです。これから解説する手順を通じて、pywinautoの活用方法を習得しましょう。

pywinautoのインストール方法

pywinautoを使用するには、まずPython環境にライブラリをインストールする必要があります。以下の手順に従えば、簡単にインストールを行うことができます。

インストール手順

ターミナルまたはコマンドプロンプトを開き、以下のコマンドを実行してください:

pip install pywinauto

これでインストールが完了します!このコマンドを実行すると、pywinautoライブラリがPython環境に追加されます。

インストール確認

インストールが正しく行われたかを確認するには、以下のコマンドを実行してバージョンを表示させます:

python -c "import pywinauto; print(pywinauto.__version__)"

エラーが発生せず、バージョン情報が表示されればインストールは正常に完了しています。

pywinautoの詳細な情報については、公式ドキュメントをご覧ください。

画面の要素を取得する

pywinautoでは、アプリケーション内のウィンドウやその内部のコントロール(ボタン、テキストボックスなど)を操作するために、まず対象となる画面要素を取得する必要があります。このプロセスは、後続の「テキスト入力」や「ボタン押下」の操作の基礎となる重要なステップです。

ウィンドウの取得

まず、操作対象のアプリケーションを起動または接続し、対象のウィンドウを取得します。以下はメモ帳(Notepad)を例にした基本的な手順です。

from pywinauto import Application

# アプリケーションを起動
app = Application(backend="uia").start("notepad.exe")

# ウィンドウを取得
dlg = app.window(title="無題 - メモ帳")  # タイトルでウィンドウを特定

print("ウィンドウを取得しました!")

ここでは、backend="uia"を指定してUI Automationバックエンドを使用しています。他にもwin32バックエンドを使用することが可能ですが、uiaはより多くの要素を操作できるため、汎用性が高いです。

コントロール要素の取得

ウィンドウ内の具体的なコントロール要素を操作するには、child_window()メソッドを使用して特定の要素を取得します。以下に例を示します:

# テキストエリアを取得
edit = dlg.child_window(title="テキスト エディット", control_type="Edit")

# ボタンを取得(例:保存ダイアログの「保存」ボタン)
button = dlg.child_window(title="保存", control_type="Button")

print("要素を取得しました!")

titleは要素のラベルや名前、control_typeは要素の種類(例:EditButtonなど)を指定します。これにより、正確な要素を特定することが可能です。

コントロール要素を確認する

取得できる要素を一覧で確認するには、print_control_identifiers()メソッドを使用します。これにより、ウィンドウ内のすべての要素とその詳細を表示できます。

# ウィンドウ内のすべてのコントロールを一覧表示
dlg.print_control_identifiers()

この出力を参考にすることで、操作対象の要素のtitlecontrol_typeを確認し、取得する方法を特定できます。

まとめ

pywinautoを使用すると、ウィンドウやその内部のコントロール要素を簡単に取得することができます。この基礎を理解しておくことで、次のステップである「テキスト入力」や「ボタン押下」といった操作をスムーズに進めることが可能です。次は、画面要素で取得できる種類について詳しく解説します。

画面の要素で取得できる種類の説明

pywinautoでは、画面上のさまざまなUI要素(ボタン、テキストボックス、リスト、ラジオボタンなど)を取得して操作できます。これらの要素に対して、どのような情報が取得可能か、またどのような操作ができるかを具体例とともに紹介します。

ボタン要素

ボタンは、ユーザーがクリックしてアクションを実行するための要素です。pywinautoでは、ボタン要素を取得し、以下の操作が可能です:

  • ボタンをクリック
  • ボタンのラベル(テキスト)を取得
  • ボタンが有効か無効かを確認
from pywinauto import Application

# メモ帳を起動し、ダイアログの「OK」ボタンを取得
app = Application(backend="uia").start("notepad.exe")
dlg = app.window(title="無題 - メモ帳")

# ボタン要素を取得
ok_button = dlg.child_window(title="OK", control_type="Button")

# ボタン操作
print("ボタンのラベル:", ok_button.window_text())
print("ボタンは有効か:", ok_button.is_enabled())
ok_button.click()  # ボタンをクリック

テキストボックス要素

テキストボックスは、文字入力を行うための要素です。pywinautoを使うと、以下の操作が可能です:

  • テキストボックスに文字を入力
  • 現在入力されているテキストを取得
  • テキストボックスをクリア
# テキストボックス要素を取得
edit_box = dlg.child_window(control_type="Edit")

# テキストボックスに文字を入力
edit_box.type_keys("Hello, pywinauto!")

# テキストを取得
print("入力されたテキスト:", edit_box.window_text())

チェックボックス要素

チェックボックスは、オン/オフの切り替えを行う要素です。以下の操作が可能です:

  • チェックをオンまたはオフにする
  • 現在の状態を取得(オン/オフ)
# チェックボックス要素を取得
checkbox = dlg.child_window(title="Enable Feature", control_type="CheckBox")

# チェックボックス操作
checkbox.check()  # チェックをオン
checkbox.uncheck()  # チェックをオフ
print("チェックボックスの状態:", checkbox.get_toggle_state())

ラジオボタン要素

ラジオボタンは、複数の選択肢の中から1つを選択するための要素です。以下の操作が可能です:

  • 特定のラジオボタンを選択
  • 現在選択されているかを確認
# ラジオボタン要素を取得
radio_button = dlg.child_window(title="Option 1", control_type="RadioButton")

# ラジオボタン操作
radio_button.select()
print("ラジオボタンが選択されているか:", radio_button.is_selected())

ドロップダウンリスト要素

ドロップダウンリストは、複数の選択肢を表示するための要素です。以下の操作が可能です:

  • リストから項目を選択
  • 現在選択されている項目を取得
# ドロップダウンリスト要素を取得
dropdown = dlg.child_window(control_type="ComboBox")

# ドロップダウン操作
dropdown.select("Option 1")  # 項目を選択
print("選択されている項目:", dropdown.selected_text())

まとめ

pywinautoを使うと、ボタンやテキストボックス、チェックボックス、ラジオボタン、ドロップダウンリストなど、さまざまな要素を取得し、それぞれに対して柔軟な操作を行うことができます。これらの基本的な操作を組み合わせることで、Windowsアプリケーションの自動化を効率的に進めることができます。

次は、具体的な操作として、テキストボックスへの入力方法を解説します。

テキスト入力の方法

WindowsアプリケーションのGUI操作でよく利用されるのが、テキストボックスへの文字入力です。このセクションでは、pywinautoを使用して特定のテキストボックスを取得し、文字を入力する具体的な方法を解説します。画面要素の取得を応用して、実際に文字入力を行うコード例を示します。

テキストボックスを取得する

まず、対象となるウィンドウ内のテキストボックスを取得します。以下は、メモ帳(Notepad)を例にした基本的なコードです:

from pywinauto import Application

# メモ帳を起動
app = Application(backend="uia").start("notepad.exe")

# メモ帳のウィンドウを取得
dlg = app.window(title="無題 - メモ帳")

# テキストボックス(エディットエリア)を取得
edit_box = dlg.child_window(control_type="Edit")

print("テキストボックスを取得しました!")

テキストを入力する

テキストボックスを取得したら、type_keys()メソッドを使用して文字を入力します。このメソッドは、キーボードの入力をシミュレートします。

# テキストを入力
edit_box.type_keys("Hello, pywinauto!")

print("テキストを入力しました!")

このコードを実行すると、メモ帳のテキストエリアに「Hello, pywinauto!」が入力されます。

現在のテキストを取得する

テキストボックスに既に入力されている文字列を取得するには、window_text()メソッドを使用します。

# 現在のテキストを取得
current_text = edit_box.window_text()
print("現在のテキスト:", current_text)

このコードでは、テキストボックスに入力されている文字列がコンソールに表示されます。

テキストボックスをクリアする

テキストボックスをクリアして、入力済みの文字列を消去することも可能です。以下のコードを参考にしてください:

# テキストボックスをクリア
edit_box.set_edit_text("")

print("テキストボックスをクリアしました!")

set_edit_text()メソッドを使うと、テキストボックスをクリアしたり、直接文字列を指定して設定することもできます。

まとめ

テキストボックスへの入力操作は、GUI自動化の中でも基本的かつ頻繁に利用される機能です。pywinautoを使用すれば、簡単なコードでテキストボックスを取得し、入力、編集、クリアといった操作が可能です。

次は、もう一つの基本操作である「ボタン押下」の方法を解説します。

ボタン押下の方法

ボタンを押す操作は、テキスト入力に続く基本的なGUI操作の一つです。pywinautoを使用すれば、特定のボタンを取得し、クリックアクションを簡単に実行できます。このセクションでは、ボタンを押下する具体的な方法と、入力後に送信ボタンを押すシナリオなどの活用例を紹介します。

ボタン要素を取得する

まず、対象のウィンドウ内で特定のボタンを取得します。以下は、メモ帳の「保存」ボタンを取得する例です:

from pywinauto import Application

# メモ帳を起動
app = Application(backend="uia").start("notepad.exe")

# メモ帳のウィンドウを取得
dlg = app.window(title="無題 - メモ帳")

# 保存ダイアログの「保存」ボタンを取得(仮定のシナリオ)
save_button = dlg.child_window(title="保存", control_type="Button")

print("ボタンを取得しました!")

child_window()メソッドでtitle(ボタン名)やcontrol_typeを指定して、正確にボタンを特定します。ウィンドウ内の要素が多い場合は、print_control_identifiers()で要素を調べることをおすすめします。

ボタンをクリックする

ボタンを取得したら、click()メソッドを使用して押下アクションを実行します。

# ボタンをクリック
save_button.click()

print("ボタンをクリックしました!")

このコードを実行すると、指定した「保存」ボタンが押されます。

入力後にボタンを押すシナリオ

テキストボックスに文字を入力してから送信ボタンを押すなどのシナリオも簡単に実現できます。以下はその例です:

# テキストボックスに文字を入力
edit_box = dlg.child_window(control_type="Edit")
edit_box.type_keys("Hello, pywinauto!")

# 「送信」ボタンを押す
send_button = dlg.child_window(title="送信", control_type="Button")
send_button.click()

print("テキストを入力し、ボタンを押下しました!")

このように、異なる要素を組み合わせて一連の操作を自動化できます。

ボタンの有効性を確認する

ボタンが押下可能か(有効か)を確認するには、is_enabled()メソッドを使用します。以下のコードはその例です:

# ボタンが有効かどうか確認
if save_button.is_enabled():
    save_button.click()
    print("ボタンを押しました!")
else:
    print("ボタンは無効です。")

ボタンの状態をチェックしてからアクションを実行することで、エラーを防ぐことができます。

まとめ

pywinautoを使えば、ボタンの取得からクリックまで、非常に簡単にスクリプト化できます。また、テキスト入力と組み合わせることで、実用的なシナリオを構築できます。これらの基本操作を習得すれば、Windowsアプリケーションの自動化でさまざまなタスクを効率化することが可能です。

これで、pywinautoを使った「テキスト入力」と「ボタン押下」の方法を学びました。次のステップとして、複雑な操作や複数ウィンドウの制御に挑戦してみてください。

関連記事

RPA--PYWINAUTO
「RPA--PYWINAUTO」の記事一覧です。

コメント

タイトルとURLをコピーしました