marke Trans

marke Trans

GA4のデータを見て「で、何から改善する?」と迷う時間をゼロにする方法-複数指標を点数化する「加重スコア」で、LP改善の優先順位を一瞬で決める。

【コラム】 2026.01.18

Web担当者の方とお話しすると、こんな声をよく聞きます。
「GA4のデータは見ているんですが、改善箇所が多すぎて、何から手をつけていいか分からなくて……」

その気持ち、よく分かります。Google Analytics 4(GA4)には豊富な指標が用意されていますが、データが多いほど、かえって意思決定が遅くなるのが現場のリアルです。

この記事では、複数の指標を点数化して統合する「加重スコア」という手法を使い、LP(ランディングページ)や広告の改善優先順位を、客観的かつスピーディに決める方法をご紹介します。

私自身、この方法を導入してから、クライアント企業での改善会議が「1時間の議論」から「10分の確認」に変わりました。

この記事を読むとわかること

  • 「改善候補が多すぎて決められない」状態を抜け出す、具体的な優先順位の付け方
  • LP・広告・流入経路を100点満点の共通指標で比較する方法
  • 少数サンプルによる判断ミスを防ぐ「信用スコア」の考え方
  • チーム内で判断基準を統一し、意思決定のスピードを上げる仕組み

特に、マーケティング施策の意思決定を担う方、複数のLP・広告を運用されている方に役立つ内容です。

目次

1. なぜGA4のデフォルト指標では「優先順位」が決めにくいのか

GA4が提供する指標は非常に優秀です。しかし、それらは「現状の観測」には強くても、「次の一手の決定」には直結しにくいという特徴があります。

よくある判断ミスの例:「平均エンゲージメント時間」の罠

たとえば、ある広告経由のLPで「平均エンゲージメント時間が180秒」という数値が出たとします。
一見すると「3分も滞在しているなら、しっかり読まれている」と判断したくなりますよね。

ところが、Microsoft Clarity(ユーザー行動の録画ツール)で実際の動きを確認すると、こんなケースがよくあります。

  • 広告をクリックしてLPを開く
  • そのまま別のアプリに切り替える(または放置)
  • セッションが自動終了するまでの時間が「滞在時間」としてカウントされる

つまり、「長い=良い」とは限らないのです。
このように、単一指標だけを見て判断すると、実態とズレた意思決定をしてしまうリスクがあります。

2. 「精読されているか」を測る代替指標の作り方

そこで私が現場で使っているのが、スクロール深度とエンゲージメント時間を組み合わせた「精読率」という考え方です。

前提:スクロール深度は細かく取得しておく

GA4のデフォルト設定では、スクロールは「90%到達」しか計測されません。これでは改善に使うには情報が粗すぎます。
Google Tag Manager(GTM)を使って、以下のような深度でイベントを送信する設定をおすすめします。

  • 25%到達
  • 50%到達
  • 75%到達
  • 90%到達

(設定方法の詳細は、GA4公式ドキュメントやGTM解説記事をご参照ください)

スクロール深度別の「到達数」と「平均滞在時間」を見る

この2つの軸を組み合わせると、ユーザーの行動パターンが明確に見えてきます。

スクロール深度 平均滞在時間 推測される状態 改善の方向性
浅い 短い 即離脱(FVで離脱) FV改善・表示速度改善・広告との整合性確認
浅い 長い FV周辺で迷っている・放置 判断材料の追加・CTA誘導強化
深い 短い 流し読み(探している情報がない) 見出し改善・結論の繰り上げ・ナビゲーション追加
深い 長い しっかり読まれている(精読) CVしない理由の深堀り(手順・価格提示・CTA設計など)

このように、複数指標を組み合わせることで、初めて「次の一手」が見えてくるのです。

3. 「加重スコア」とは? 複数指標を優先順位に変換する仕組み

ここまで見てきたように、実務では複数の指標を総合的に判断する必要があります。
ただし、毎回それを頭の中でやっていると、

  • 判断する人によって結論がブレる
  • 会議で意見が割れて時間がかかる
  • 過去の判断基準が残らず、ノウハウが属人化する

といった問題が起きます。
そこで導入するのが「加重スコア」です。

加重スコアの定義

複数の指標を0〜100点の共通スケールに変換し、重要度に応じた重みをつけて合算したもの。

これにより、LP・広告・流入経路などを同じ土俵で比較し、改善優先順位を客観的に決められるようになります。

4. 加重スコアの作り方(実務で使えるテンプレート付き)

ここからは、実際に加重スコアを作る手順を解説します。Google スプレッドシートやLooker Studio(旧Google データポータル)などで実装可能です。

Step0:何を比較するかを決める(比較単位の設定)

加重スコアは「並べ替えるための指標」なので、まず何を並べるかを決めます。

  • LP別:ページ単位で優先順位をつける
  • 広告別:キャンペーン・広告セット・クリエイティブ単位
  • 流入経路別:チャネル・参照元別

初めて導入する場合は、LP別から始めるのがおすすめです。

Step1:使う指標を選ぶ(役割ごとに1つずつ)

今回は例として、以下の3つの指標を使います。

  1. 成果指標:コンバージョン率(CVR)
  2. 関心指標:平均エンゲージメント時間
  3. 読了指標:平均スクロール率

ポイントは、指標の役割が重複しないようにすることです(後述)。

Step2:各指標を0〜100点に変換する(正規化)

単位が異なる指標をそのまま足し算することはできないので、すべて「点数」に変換します。

① エンゲージメント時間の点数化

例:上限を120秒に設定

  • 120秒以上 → 100点
  • 60秒 → 50点
  • 2秒未満 → 1点(最低保証)

計算式は線形で十分です。完璧な関数を探すと設計が複雑になり、運用が回らなくなります。

② スクロール率の点数化

  • 平均スクロール率(%)= そのまま点数として使用
  • 例:75% → 75点

③ CVRの点数化

  • CVR(%)= そのまま点数として使用
  • 例:CVR 3.5% → 3.5点

Step3:重み(重要度)を設定する

各指標に「重み」をつけて合算します。
例として、以下のような配分にします。

  • CVR:50%
  • エンゲージメント時間:25%
  • スクロール率:25%

これにより、加重スコアは次のように計算されます。

加重スコア = (0.50 × CVR点数) + (0.25 × 滞在点数) + (0.25 × スクロール点数)

結果は100点満点で表示され、LP同士を同じ基準で比較できるようになります。

【重要】重みは「フェーズ別プリセット」で運用する

「正解の重み」を探し始めると、永遠に決まりません。
そこで私は、施策のフェーズごとにあらかじめ重み配分を決めておく方法を推奨しています。

フェーズ 状況 重み配分(CV / 滞在 / スクロール)
検証フェーズ CVがまだ少ない段階 0.35 / 0.35 / 0.30
拡張フェーズ 勝ちパターンが見えてきた 0.60 / 0.20 / 0.20
最適化フェーズ 細かい摩擦を除去する段階 0.50 / 0.30(中間CV) / 0.20

このように「なぜその配分にしたか」を説明できるなら、数値は仮置きで構いません。

5. 加重スコアで優先順位を決める方法(2軸×4象限)

加重スコアは、単純にランキング化するだけでも使えますが、実務でより効果を発揮するのは「2軸で4象限に分ける」方法です。

LP別の場合:セッション数 × 加重スコア

縦軸に「セッション数」、横軸に「加重スコア」を置いて、4つの象限に分類します。

象限 セッション数 加重スコア 判断
右上 多い 高い 保守(勝ちパターン・現状維持)
左上 多い 低い 最優先で改善(効果が大きい)
右下 少ない 高い 流入施策の見直し(広告・SEO強化)
左下 少ない 低い 後回し or 停止検討

この分類により、「どこから手をつけるべきか」が一目で判断できるようになります。

6. 広告別で使うなら必須:「信用スコア」で少数サンプルを補正する

広告別で加重スコアを使う際、最も厄介なのが少数サンプルの上振れです。
例えば、「セッション1件、CV1件」の広告があったとします。CVRは100%なので、加重スコアも非常に高くなり、ランキング上位に表示されます。
しかし、これは単なる偶然である可能性が高く、翌日には普通にCVRが下がることがほとんどです。

信用スコアの設計例

セッション数に応じて、加重スコアに「信頼度補正」をかけます。

セッション数 信用スコア
200以上 1.0
100〜199 0.7
50〜99 0.4
0〜49 0.1

そして、最終的なスコアは次のように計算します。
最終スコア = 加重スコア × 信用スコア
さらに安全性を高めるなら、最低セッション数(例:50件未満)で足切りするのも有効です。

7. 実装テンプレート(スプレッドシートでもLookerでも使える)

以下、実装時のカラム構成と計算式の例です。

使用するカラム

  • sessions(セッション数)
  • cvr(コンバージョン率・%)
  • avg_engagement_sec(平均エンゲージメント時間・秒)
  • avg_scroll_rate(平均スクロール率・%)

点数化の計算式

# CV点数
cv_score = cvr

# スクロール点数
scroll_score = avg_scroll_rate

# 滞在点数(上限120秒)
engagement_score = MIN( (avg_engagement_sec / 120) * 100 , 100 )
# 最低点を設けるなら MAX(engagement_score, 1)

加重スコアの計算(重み:CV 50% / 滞在 25% / スクロール 25%)

weighted_score = (0.5 * cv_score) + (0.25 * engagement_score) + (0.25 * scroll_score)

信用スコアの計算

confidence = 
  IF(sessions >= 200, 1.0,
    IF(sessions >= 100, 0.7,
      IF(sessions >= 50, 0.4, 0.1)))

最終スコア

final_score = weighted_score * confidence

8. 加重スコアを使う際の注意点(よくある失敗パターン)

便利な手法ほど、落とし穴もあります。以下の3点を押さえておくと、運用時のトラブルを避けられます。

注意点1:少数サンプルを過大評価してしまう

対策:

  • 最低セッション数で足切りする
  • 信用スコアを導入する(二段構え推奨)

注意点2:似た指標を複数入れて「二重加点」してしまう

例えば、「エンゲージメント時間」と「セッション時間」を両方入れると、実質的に同じ要素を2回評価することになります。
対策:
指標を「役割」で分類し、1つの役割につき1つの指標を使う。

  • 成果系:CVR / キーイベント率
  • 関心系:エンゲージメント時間
  • 読了系:スクロール率
  • 導線系:クリック率 / フォーム開始率

「どの指標を使うか」より、「評価の重複を避ける」方が重要です。

注意点3:重みの「正解探し」で時間を浪費する

対策:

  • 重みは仮置きでOK
  • その代わり「なぜその配分にしたか」をチーム内で説明できるようにする
  • フェーズ別プリセットを用意して、運用を固定化する

9. 週次運用ルーチン(迷わず回す仕組み化)

加重スコアは「作って終わり」ではなく、定期的に見る習慣をつけることで真価を発揮します。

おすすめの週次ルーチン

  1. LP別の4象限図を確認し、「改善最優先」に分類されたものを3つ選ぶ
  2. その3つだけ、Clarityやヒートマップで詳細な行動を確認し、仮説を立てる
  3. 改修を実施し、翌週のスコア変化を確認
  4. 広告別は「信用スコア込みの最終スコア」で残す・止めるを判断

「全部見る」のをやめて、「見る順番を固定する」。これが継続的に成果を出すコツです。

まとめ:加重スコアの目的は、意思決定の高速化とチーム内の判断基準統一

加重スコアの本質は、精緻な学術モデルを作ることではありません。
チーム全体が、同じ基準で、素早く、納得感を持って意思決定できる状態を作ることです。

この記事でご紹介した手順は、以下の通りです。

  1. 使う指標を選ぶ(役割ごとに1つずつ)
  2. 各指標を0〜100点に変換する
  3. 重みをつけて合算する
  4. 広告別なら信用スコアで補正する
  5. 2軸×4象限で優先順位を決める

「数字の見方」より難しいのは、「次の一手を決めること」です。
もし「このLP群、どこから改善すべきか分からない」「広告運用の優先順位を明確にしたい」とお悩みなら、お気軽にご相談ください。貴社の状況に合わせた加重スコア設計から、運用定着までサポートいたします。


関連リンク

メディア

Media
一般社団法人 ウェブ解析士協会

(一社)ウェブ解析士協会の公式noteの運営を受託しています。
デジタルマーケティングに関するお役立ち情報を毎週投稿しています。

note 記事を読む