久々のブログ更新です。なかなかまとまった時間がとれず随分間が開いてしまいましたが、決してネタが無いわけではありません(必死)
さて、今回はGoogle Webmaster Central Blogにて面白い記事がアップされたのでそのご紹介です。
⇒ Download search queries data using Python
Googleが公開したPythonスクリプト使用してウェブマスターツールの検索クエリをCSV形式でダウンロードし、かつGoogle Docsにアップロードしてしまおう!という内容です。
面白い内容なのですが、プログラミングに慣れていない方には少し敷居が高い作業となるかもしれません。ですがやってみると意外にすんなり行くと思うので簡単にセットアップ手順をご紹介します。
最初に全体の流れを説明すると以下の手順になります。
- Pythonのダウンロードとインストール
- Google Data APIs Python Client Libraryとダウンロードとインストール
- downloader.pyをダウンロードし、適当なディレクトリに設置
- example-create-spreadsheet.pyのダウンロード、およびデータを取得するサイトURLとそれを管理しているGoogelアカウントのemail、パスワードの書き換え
- ターミナルからexample-create-spreadsheet.pyを実行
- Google Docsで取得
では順番に追って行きましょう。
1.Pythonのインストール
Pythonというのは、オブジェクト指向のスクリプト言語で、Perlとならんで普及している言語の一つです。今回紹介するプログラムはPython上で動かすため、作業するマシンにPythonをインストールする必要があります。
Pythonのバージョンは2.5以上である必要があります。2.5未満の場合、別途ElementTreeというXML関連のライブラリをインストールする必要があります。ここでは2.5以上のPythonを使っているという前提ですすめますので、2.5未満の場合は最新版にするか、ElementTreeをインストールして下さい。
Windowsの場合
Pythonのダウンロードページにインストーラーが用意されています。
⇒http://www.python.org/download/

ここでは最新の2.7.2を選びました。
クリックするとインストーラーがダウンロードされます。
あとはインストーラーを実行し、画面の指示に従ってインストールします。
インストールが正常に完了したか確認します。
コマンドプロンプトを立ち上げ、python –V と打ってみてください。
コマンドプロンプトは、プログラムとファイルの検索 から cmd と検索すると出てきます。

このようなメッセージが表示される場合、パスの設定を行う必要があります。
システムのプロパティより環境変数を選択します。

システム環境変数にある、Pathを選択します。

Pythonのインストール先を追加します。(『;』で連携します)

この例では、C:\Python\Python27 という場所にインストールしたのでそれを追加しました。
コマンドプロンプトを exit で一度終了させ、再度立ち上げ直します。
新しく立ち上げ直したコマンドプロンプトで、path と打ち、パスが通っているか確認します。

このように追加したパスが表示されればOKです。
もう一度 python -V を試してみます。

このようにバージョンが表示されればOKです。
Mac OS X の場合
Mac OS Xの場合はすでにPythonがインストールされています。ユーティリティの中のターミナルを立ち上げ、同じように python –V でバージョンを確認してみましょう。
2.Google Data APIs Python Client Libraryのインストール
gdataを扱うためのGoogleが提供しているPythonライブラリをインストールします。
⇒http://code.google.com/p/gdata-python-client/downloads/list
現時点(2011/12/24)では2.0.15が最新のようです。

ダウンロード後、解凍します。
解凍したディレクトリにcdコマンドで移動し、python setup.py install と打ちインストールを実行します。

例はWindowsのコマンドプロンプですが、Macのターミナルからも同じ手順となります
インストールされたかどうかの確認
テスト用のスクリプトを実行するため、 python tests/run_data_tests.py と打ち込みます。

つらつらとテストが実行されますが、すべてにOKが表示されれば完了です。
3.downloader.pyのダウンロード
ここまでくれば、あともう一息です。
downloader.pyをダウンロードし、適当なディレクトリに設置します。
2011/12/24現在、ファイルはダウンドードできないようで、その場合はコードをコピーして”downloader.py”という名前で保存します。
4.example-create-spreadsheet.pyのダウンロードと編集
example-create-spreadsheet.pyをダウンロードし、downloader.pyと同じディレクトリに設置します。
ソースをテキストエディタで開き、 Email address and password used to sign-in to Webmaster Tools and Google Docs と書いてある箇所を変更します。

- email・・・Googleアカウントでログインするアドレス
- password・・・パスワード
- website・・・検索クエリを取得するサイトのURL(スラッシュで閉じる必要があるっぽい)
5.example-create-spreadsheet.pyを実行
ファイルを設置したディレクトリに移動し、 python example-create-spreadsheet.py と実行します。
成功の例

以下のように、Google DocsへのURLが表示されれば成功です。(例ではkeyの値はマスクしています)
失敗の例
アカウント情報が正しくないと BadAuthentication がでます。

また、websiteが正しくないなど、取得できる値が無いと ValueError となります。
URLが正しいか確認しましょう。なお、URLの末尾が『/』スラッシュで終わっていない時もこのエラーがでます。

見慣れないとぎょっとすると思いますが、エラーの内容は書いてあるので落ち着いて対処しましょう。
6.Google Docsで確認
Google Docsで見てみると、このようにCSVファイルがアップロードされました。

開いてみるとこのように。

おわり
以上、簡単ではありますが、最低限のサンプルとしてWebmaster Central Blogに書いている内容そのままを実行してみました。
汎用的にするのであれば、アカウント情報などはプログラムソースの外から渡すようにしたりするのが良いでしょう。
また、スケジューラーと組み合わせれば定期的に検索クエリをダウンロードするという手間が自動化できます。
皆さんだったらどう活用するでしょうか。