-->

【KNIME】(ナイム)Google Analyticsノード サイト管理者必見!グーグルアナリティクスのデータをエクセル抽出!KNIME上で扱う方法。【ノード紹介】

2022/05/09

Googleアナリティクス Knime

t f B! P L

・この記事の概要

KNIME(ナイム)でGoogle Analytics(グーグルアナリティクス)のデータを
扱う方法について解説しています。

GoogleアナリティクスのPV数やセッション数を含む沢山のデータを一気にKNIME上に
取り込むことができます。
KNIMEで取り込んだデータはエクセルやCSVにも使用可能です。




まえがき

どうもシャイン社員です。
皆様GWはいかがお過ごしでしたでしょうか?
今年のGW例によって腕骨折により遠出せずに自宅周辺をうろうろしていました(笑)

今回はGoogleアナリティクスをKNIME上で扱う方法についてまとめてみました。


KNIMEは何?っという方は下記の記事をご参照ください。

本ページはKnimeの使い方やできること、などについて説明しています。Knimeはエクセルと同じように表計算ができる無償ソフトウェア エクセルと違ってVBA記述など不要でマクロをどうさせることが来ます。 ワークフローと呼ばれるカラフルな四角いマークと矢印をつなぐことで動かす

Googleアナリティクスとは

グーグルアナリティクス(Google Analytics)は
「ホームページへの訪問者数」や「サイト内でのユーザー行動」が分析できるツールです。

・何人のアクセスがあったのか?
・どれくらいの時間サイトに滞在していたのか?
・どんなキーワード・経路で検索して訪れたのか?
GoogleアナリティクスはWebサイトのユーザー行動を「見える化」してくれる無料ツールであり
あらゆるサイトの管理するために役に立つ分析ツールの事です。

ご存じない方は詳細は下記の記事が参考になると思います。

GoogleアナリティクスはWebサイトのユーザー行動を「見える化」してくれる無料ツールであり、Webサイトに必要不可欠。そこで本記事では、Webサイトの改善に役立つGoogleアナリティクスの設定方法から基本的な使い方・設定を解説します。

そのGoogleアナリティクスのデータをKNIME上で扱うことができます。

これがどういう事が出来るかっていうと
サイト訪問者数やページビュー数、平均滞在時間を表データで出力することができます。
そのままKNIME上でデータを扱うも良し
エクセルなどに出力することも出来ちゃいます!

先ほど述べたようにGoogleアナリティクスはサイト運営者にとって非常に有効なツールです。
ワタクシも含めブログ運営者の方のほぼすべてがこのツールを使っていると思います。

Web上のGoogleアナリティクスでマウスをポチポチしてアクセス解析をしてもいいのですが
KNIME上でアナリティクスのデータにアクセスしてデータを取得し瞬時にグラフ化、
先月比較や前年度比較などを表やグラフで行う方が効率化できると思います。

本記事ではそのやり方を解説していきます。
それでは見ていきましょう。

KNIME Google Connectorsをインストールする

Google関係のKNIMEノードはKNIME標準搭載ノードではありませんので
KNIME上で新たにインストールする必要があります。

KNIMEを起動し「File」→「Install KNIME Extensions...」の順にクリックします。



Install画面が開かれますので
テキストボックスに「Google」と入力します。

すると自動で「Google」に関係するアドオンが検索されます。
KNIME Google Connectorsにチェックを入れて
「Next」を押します。

もう一度Nextを押します。

ライセンス確認画面になるので「Finish」を押します。



無事にインストールが完了すると
再起動をを求められます。

Restart NowでKNIMEを再起動します。
これでKNIMEへのGoogle Connectorsのインストールは完了です

ワークフローの作成。ノードの配置方法

KNIME Google Connectorsをインストール完了しKNIMEを再起動したら
ワークフローを作成します。

Node Repository画面に「Google」と入力します。
するとGoogle Connectorノードが一覧で出てきます。

アナリティクスのほかにGoogleドライブにアクセスしたり
Googleスプレッドシートにアクセス出来たり
様々な動作をKNIMEから制御するノードがそろっております。


その中から
「Google Authentication」
「Google Analytics Connection」
「Google Analytics Query」
の三つのノードをワークフロー上に配置し下記の様に接続します。

これで最低限のワークフローは完成です。
お好みで後段にグラフやFilterなどのノードを追加して自分好みにカスタマイズできます。

Google Authenticationノードでサインインする



まずはGoogle Authenticationノードの解説です。
このノードにてKNIMEからGoogleアカウントへの認証を行います。

右クリックをしてConfigureを選択します。
すると下記のような画面となります。

Configure画面の解説

Congifureの画面を解説していきます。

まず最初に「Scopes」の部分にある
「Google Analytics Connection (Read)」にチェックを入れます。
他の選択肢についてはチェックを入れていても、入れなくてもどちらでも構いません。

下記のように設定します。
私の場合は不要なチェックは外しました。



続いてGoogleアカウントへの認証です。
デフォルトの状態だとStatus :Unknownとなっているかと思います。
この状態はまだGoogleに認証許可されていない状態です。
左のGoogleマークの「Sign in with Google」をクリックしてください。


するとブラウザソフトが起動し、Googleへのログイン画面が立ち上がりますので
Googleアナリティクスを使用するアカウントを選択し、ログインします。


ログインするとKNIMEがGoogleアカウントにアクセスをリクエストしてきますので
許可をクリックします。

ブラウザに「Received verification code. You may now close this window.
と表示され、Configureの画面では
Status :Authenticatedとなり、認証が完了したことになります。

ここまでできましたら「OK」をクリックして設定完了です。


Google DriveやGoogle Sheetへのアクセスも可能

勘の良い方ならわかると思いますが
Google AuthenticationノードのConfigure画面の「Scopes」の設定にあるように
Google DriveやGoogle Sheetにアクセス認証も可能です。

こちらの使い方については後日綴っていきます。

下記のサイトさんで紹介されていますので参考になるかと思います。



Google Analytics Connectionの設定方法


続いてGoogle Analytics Connectionの設定方法についてです。

一度Google Authenticationノードを実行(Execute)して実行完了にします。

Googleへのアクセス認証がうまく行くと自動的にConfigureの項目が記入されますので
特に何もしなくてOKです。

強いて言うとプロファイルIDを確認しておくと安心です。


確認したら「OK」を押してExecuteします。

Google Analytics Queryノードの解説



続いてGoogle Analytics Queryノードの解説をしていきます。
こちらのノードで実際にGoogleアナリティクスからアクセスデータを引っ張ってきます。

詳細な設定を行うために右クリックからConfigureをクリックします。
下記のような画面になります。



ここから様々な項目を選択してテーブルデータに出力できます。
まず上半分の設定項目について説明します。



まずデフォルトで書いてある
「All」という箇所をクリックして抽出したいデータのカテゴリを選択できます。

カテゴリの中に細かい対象となるデータ項目が複数あります。
様々なカテゴリがありますが主に使うのは下記の項目かと思います。
  • Users(user):ユーザー数などユーザーに関わるカテゴリ
  • Time:日付や月、週、年など時間に関わるカテゴリ
  • Session:セッション数などセッションに関わるカテゴリ
  • Pages Tracking:ページビューなどページに関わるカテゴリ

今回は例として日ごとの訪問ユーザー数を抽出してみましょう。


カテゴリから「Time」を選択し、データ項目は「Date(date)」を選択
「Add」をクリックします。
Dimentionsに「date」が追加されたと思います。
これで日にちごとのデータが出力されます。


同様にカテゴリから「User」を選択し、データ項目は「Users(users)」を選択
「Add」をクリックします。
下記のような画面になったらOKです。



データ取得期間の設定Start date / End date について

取得するデータの期間を設定します。
Start dateからEnd dateまでのデータのみを抽出します。
とりあえず今回は5/2-5/9までの1週間分のデータとします。
これでOKをクリックします。

よく使うデータ項目の解説

グーグルアナリティクスでよく使うデータ項目を下記に列挙します。
これらの項目をセットすることでGoogleアナリティクスのウェブページに乗っている情報と
同じ情報を取りに行くことができると思います。

■User
 users:ユーザー数
 NewUsers:新規ユーザー数
 Number of Sessions per User(sessionsPerUser):

■Page Tracking
 Page (pagePath):ページパス
 pageviews:PV数
 Pages / Sessison (pageviewsPerSession):ページ/セッション

■Session
 sessions:セッション数
 Avg.Session Duration (avgSessionDuration) :平均セッション時間

■Time
 Date(date):日付ごと
 Year(year):年ごと
 Month of the year (month):月ごと
 Week of the Year (week):週ごと
 Month Index(nthMonth):Start date月を0としてEnd dateをN番目と表示

■どの項目に含まれているか不明だったのでALLから選択
 Bounce rate:直帰率

そのほかの設定

Segmentの項目から「Use predefined segmet」を選択することで
さらに抽出するデータを絞ることができますが混乱しやすいので
基本的に全出力設定する
「Use dynamix segment」を選択しテキストボックスは空欄にしておくことをお勧めします。

FilterやSort、Start indexなどで細かく出力データを設定することも出来ますが
細かい設定が必要なければ特に空白のままでOKです。

ノードの出力結果

ノードの結果は下記になります。

ちゃんと日付ごとのユーザー訪問数が一覧表になっています

期間を1週間でなく1ヵ月や100日などに増やすことも可能で
このままExcel Writerなどのノードを使えばエクセルに出力可能です!

せっかくなので1日当たりユーザー訪問数を線グラフにしてみました。
「String to Date &Time」ノードで文字列を日付に変換し
「Line Plot」ノードで線グラフを描画します。


出来上がったグラフがこちらになります。

このようにしてGoogleアナリティクスで表示されているようなグラフを作る事が出来ました!

自作のGoogleアナリティクスワークフロー

このブログのGoogleアナリティクスのデータを表データ化して
グラフ化したワークフローを作成しました。
こちらにワークフローを置きますのでもしご興味ある方は使ってみて下さい。

それぞれ下記のようなデータたを抽出してグラフを作成しました。

  • ページごとのPVを集計し上位10位を抜き出し、グラフ化

ページごとのPV数を集計しグラフ化したものです。
横軸がページ名称、縦軸がPV数です。
ページ名称が途切れてしまっていますが上位10位のみ抜き出しています。

  • 3か月分の日数別ユーザー数、新規ユーザー数、PV数、セッション数を同一グラフ化

ユーザー数とセッション数、PV数を横溢のグラフにあらわしたものです。
3ヵ月分のデータを日ごとにつけております。

  • 月ごとのユーザー数、新規ユーザー数、PV数、セッション数を同一グラフ化
月ごとのユーザー数、新規ユーザー数、PV数、セッション数を同一グラフ化しました。
こうやって表示することで月ごとにどのように数字が推移しているか分かりますね!

  • 週ごとのセッション/ユーザー数と、ページ/セッション数を同一グラフ化

今度は週ごとのデータを作成しました。
セッション/ユーザー数と、ページ/セッション数を表しています。
横軸の0000から始まる数字が週で0週目を表しています。
0010は10週目を表しています。

  • 平均セッション時間を週ごとに集計


平均セッション時間を週ごとに集計してみました。
これはあんまり使わない…かな?

ワークフローの全容としてはこんな感じです。





参考とさせていただいたサイト

本記事を書くにあたり下記のサイトを参考にさせていただきました。

今回ご紹介するのは、Googleと連携させるためのNodeです。 Google Spread SheetやGoogle Drive、Google Analyticsに接続するための前準備のためのNodeになります。

あとがき

いかがでしたでしょうか?
Googleアナリティクスについてはいくつか書籍も出ており、より詳しく学ぶ事が出来ます。
下記のような書籍で勉強してみるもの良いかもしれませんね!
それでは!








このブログを検索

注目の投稿

【KNIME】(ナイム)最強の表計算マクロソフト!KNIME(ナイム)のご紹介!使い方は?できることは?

この記事の概要 KNIME(ナイム)は表計算、マクロ動作を主機能とするフリーソフト。 エクセルと同等の機能を有しており、行列計算やグラフ描画可能。 ノードと呼ばれる箱を線で繋ぐことで計算処理を行う事が出来るため 関数名などを覚える必要はなく、処理の内容が分かりやすい。 Pytho...

スポンサー広告

スポンサー広告

QooQ