GA4のデータを見て「で、何から改善する?」と迷う時間をゼロにする方法-複数指標を点数化する「加重スコア」で、LP改善の優先順位を一瞬で決める。
【コラム】 2026.01.18
Web担当者の方とお話しすると、こんな声をよく聞きます。
「GA4のデータは見ているんですが、改善箇所が多すぎて、何から手をつけていいか分からなくて……」
その気持ち、よく分かります。Google Analytics 4(GA4)には豊富な指標が用意されていますが、データが多いほど、かえって意思決定が遅くなるのが現場のリアルです。
この記事では、複数の指標を点数化して統合する「加重スコア」という手法を使い、LP(ランディングページ)や広告の改善優先順位を、客観的かつスピーディに決める方法をご紹介します。
私自身、この方法を導入してから、クライアント企業での改善会議が「1時間の議論」から「10分の確認」に変わりました。
この記事を読むとわかること
- 「改善候補が多すぎて決められない」状態を抜け出す、具体的な優先順位の付け方
- LP・広告・流入経路を100点満点の共通指標で比較する方法
- 少数サンプルによる判断ミスを防ぐ「信用スコア」の考え方
- チーム内で判断基準を統一し、意思決定のスピードを上げる仕組み
特に、マーケティング施策の意思決定を担う方、複数のLP・広告を運用されている方に役立つ内容です。
目次
1. なぜGA4のデフォルト指標では「優先順位」が決めにくいのか
GA4が提供する指標は非常に優秀です。しかし、それらは「現状の観測」には強くても、「次の一手の決定」には直結しにくいという特徴があります。
よくある判断ミスの例:「平均エンゲージメント時間」の罠
たとえば、ある広告経由のLPで「平均エンゲージメント時間が180秒」という数値が出たとします。
一見すると「3分も滞在しているなら、しっかり読まれている」と判断したくなりますよね。
ところが、Microsoft Clarity(ユーザー行動の録画ツール)で実際の動きを確認すると、こんなケースがよくあります。
- 広告をクリックしてLPを開く
- そのまま別のアプリに切り替える(または放置)
- セッションが自動終了するまでの時間が「滞在時間」としてカウントされる
つまり、「長い=良い」とは限らないのです。
このように、単一指標だけを見て判断すると、実態とズレた意思決定をしてしまうリスクがあります。
2. 「精読されているか」を測る代替指標の作り方
そこで私が現場で使っているのが、スクロール深度とエンゲージメント時間を組み合わせた「精読率」という考え方です。
前提:スクロール深度は細かく取得しておく
GA4のデフォルト設定では、スクロールは「90%到達」しか計測されません。これでは改善に使うには情報が粗すぎます。
Google Tag Manager(GTM)を使って、以下のような深度でイベントを送信する設定をおすすめします。
- 25%到達
- 50%到達
- 75%到達
- 90%到達
(設定方法の詳細は、GA4公式ドキュメントやGTM解説記事をご参照ください)
スクロール深度別の「到達数」と「平均滞在時間」を見る
この2つの軸を組み合わせると、ユーザーの行動パターンが明確に見えてきます。
| スクロール深度 | 平均滞在時間 | 推測される状態 | 改善の方向性 |
|---|---|---|---|
| 浅い | 短い | 即離脱(FVで離脱) | FV改善・表示速度改善・広告との整合性確認 |
| 浅い | 長い | FV周辺で迷っている・放置 | 判断材料の追加・CTA誘導強化 |
| 深い | 短い | 流し読み(探している情報がない) | 見出し改善・結論の繰り上げ・ナビゲーション追加 |
| 深い | 長い | しっかり読まれている(精読) | CVしない理由の深堀り(手順・価格提示・CTA設計など) |
このように、複数指標を組み合わせることで、初めて「次の一手」が見えてくるのです。
3. 「加重スコア」とは? 複数指標を優先順位に変換する仕組み
ここまで見てきたように、実務では複数の指標を総合的に判断する必要があります。
ただし、毎回それを頭の中でやっていると、
- 判断する人によって結論がブレる
- 会議で意見が割れて時間がかかる
- 過去の判断基準が残らず、ノウハウが属人化する
といった問題が起きます。
そこで導入するのが「加重スコア」です。
加重スコアの定義
複数の指標を0〜100点の共通スケールに変換し、重要度に応じた重みをつけて合算したもの。
これにより、LP・広告・流入経路などを同じ土俵で比較し、改善優先順位を客観的に決められるようになります。
4. 加重スコアの作り方(実務で使えるテンプレート付き)
ここからは、実際に加重スコアを作る手順を解説します。Google スプレッドシートやLooker Studio(旧Google データポータル)などで実装可能です。
Step0:何を比較するかを決める(比較単位の設定)
加重スコアは「並べ替えるための指標」なので、まず何を並べるかを決めます。
- LP別:ページ単位で優先順位をつける
- 広告別:キャンペーン・広告セット・クリエイティブ単位
- 流入経路別:チャネル・参照元別
初めて導入する場合は、LP別から始めるのがおすすめです。
Step1:使う指標を選ぶ(役割ごとに1つずつ)
今回は例として、以下の3つの指標を使います。
- 成果指標:コンバージョン率(CVR)
- 関心指標:平均エンゲージメント時間
- 読了指標:平均スクロール率
ポイントは、指標の役割が重複しないようにすることです(後述)。
Step2:各指標を0〜100点に変換する(正規化)
単位が異なる指標をそのまま足し算することはできないので、すべて「点数」に変換します。
① エンゲージメント時間の点数化
例:上限を120秒に設定
- 120秒以上 → 100点
- 60秒 → 50点
- 2秒未満 → 1点(最低保証)
計算式は線形で十分です。完璧な関数を探すと設計が複雑になり、運用が回らなくなります。
② スクロール率の点数化
- 平均スクロール率(%)= そのまま点数として使用
- 例:75% → 75点
③ CVRの点数化
- CVR(%)= そのまま点数として使用
- 例:CVR 3.5% → 3.5点
Step3:重み(重要度)を設定する
各指標に「重み」をつけて合算します。
例として、以下のような配分にします。
- CVR:50%
- エンゲージメント時間:25%
- スクロール率:25%
これにより、加重スコアは次のように計算されます。
加重スコア = (0.50 × CVR点数) + (0.25 × 滞在点数) + (0.25 × スクロール点数)
結果は100点満点で表示され、LP同士を同じ基準で比較できるようになります。
【重要】重みは「フェーズ別プリセット」で運用する
「正解の重み」を探し始めると、永遠に決まりません。
そこで私は、施策のフェーズごとにあらかじめ重み配分を決めておく方法を推奨しています。
| フェーズ | 状況 | 重み配分(CV / 滞在 / スクロール) |
|---|---|---|
| 検証フェーズ | CVがまだ少ない段階 | 0.35 / 0.35 / 0.30 |
| 拡張フェーズ | 勝ちパターンが見えてきた | 0.60 / 0.20 / 0.20 |
| 最適化フェーズ | 細かい摩擦を除去する段階 | 0.50 / 0.30(中間CV) / 0.20 |
このように「なぜその配分にしたか」を説明できるなら、数値は仮置きで構いません。
5. 加重スコアで優先順位を決める方法(2軸×4象限)
加重スコアは、単純にランキング化するだけでも使えますが、実務でより効果を発揮するのは「2軸で4象限に分ける」方法です。
LP別の場合:セッション数 × 加重スコア
縦軸に「セッション数」、横軸に「加重スコア」を置いて、4つの象限に分類します。
| 象限 | セッション数 | 加重スコア | 判断 |
|---|---|---|---|
| 右上 | 多い | 高い | 保守(勝ちパターン・現状維持) |
| 左上 | 多い | 低い | 最優先で改善(効果が大きい) |
| 右下 | 少ない | 高い | 流入施策の見直し(広告・SEO強化) |
| 左下 | 少ない | 低い | 後回し or 停止検討 |
この分類により、「どこから手をつけるべきか」が一目で判断できるようになります。
6. 広告別で使うなら必須:「信用スコア」で少数サンプルを補正する
広告別で加重スコアを使う際、最も厄介なのが少数サンプルの上振れです。
例えば、「セッション1件、CV1件」の広告があったとします。CVRは100%なので、加重スコアも非常に高くなり、ランキング上位に表示されます。
しかし、これは単なる偶然である可能性が高く、翌日には普通にCVRが下がることがほとんどです。
信用スコアの設計例
セッション数に応じて、加重スコアに「信頼度補正」をかけます。
| セッション数 | 信用スコア |
|---|---|
| 200以上 | 1.0 |
| 100〜199 | 0.7 |
| 50〜99 | 0.4 |
| 0〜49 | 0.1 |
そして、最終的なスコアは次のように計算します。
最終スコア = 加重スコア × 信用スコア
さらに安全性を高めるなら、最低セッション数(例:50件未満)で足切りするのも有効です。
7. 実装テンプレート(スプレッドシートでもLookerでも使える)
以下、実装時のカラム構成と計算式の例です。
使用するカラム
sessions(セッション数)cvr(コンバージョン率・%)avg_engagement_sec(平均エンゲージメント時間・秒)avg_scroll_rate(平均スクロール率・%)
点数化の計算式
# CV点数
cv_score = cvr
# スクロール点数
scroll_score = avg_scroll_rate
# 滞在点数(上限120秒)
engagement_score = MIN( (avg_engagement_sec / 120) * 100 , 100 )
# 最低点を設けるなら MAX(engagement_score, 1)
加重スコアの計算(重み:CV 50% / 滞在 25% / スクロール 25%)
weighted_score = (0.5 * cv_score) + (0.25 * engagement_score) + (0.25 * scroll_score)
信用スコアの計算
confidence =
IF(sessions >= 200, 1.0,
IF(sessions >= 100, 0.7,
IF(sessions >= 50, 0.4, 0.1)))
最終スコア
final_score = weighted_score * confidence
8. 加重スコアを使う際の注意点(よくある失敗パターン)
便利な手法ほど、落とし穴もあります。以下の3点を押さえておくと、運用時のトラブルを避けられます。
注意点1:少数サンプルを過大評価してしまう
対策:
- 最低セッション数で足切りする
- 信用スコアを導入する(二段構え推奨)
注意点2:似た指標を複数入れて「二重加点」してしまう
例えば、「エンゲージメント時間」と「セッション時間」を両方入れると、実質的に同じ要素を2回評価することになります。
対策:
指標を「役割」で分類し、1つの役割につき1つの指標を使う。
- 成果系:CVR / キーイベント率
- 関心系:エンゲージメント時間
- 読了系:スクロール率
- 導線系:クリック率 / フォーム開始率
「どの指標を使うか」より、「評価の重複を避ける」方が重要です。
注意点3:重みの「正解探し」で時間を浪費する
対策:
- 重みは仮置きでOK
- その代わり「なぜその配分にしたか」をチーム内で説明できるようにする
- フェーズ別プリセットを用意して、運用を固定化する
9. 週次運用ルーチン(迷わず回す仕組み化)
加重スコアは「作って終わり」ではなく、定期的に見る習慣をつけることで真価を発揮します。
おすすめの週次ルーチン
- LP別の4象限図を確認し、「改善最優先」に分類されたものを3つ選ぶ
- その3つだけ、Clarityやヒートマップで詳細な行動を確認し、仮説を立てる
- 改修を実施し、翌週のスコア変化を確認
- 広告別は「信用スコア込みの最終スコア」で残す・止めるを判断
「全部見る」のをやめて、「見る順番を固定する」。これが継続的に成果を出すコツです。
まとめ:加重スコアの目的は、意思決定の高速化とチーム内の判断基準統一
加重スコアの本質は、精緻な学術モデルを作ることではありません。
チーム全体が、同じ基準で、素早く、納得感を持って意思決定できる状態を作ることです。
この記事でご紹介した手順は、以下の通りです。
- 使う指標を選ぶ(役割ごとに1つずつ)
- 各指標を0〜100点に変換する
- 重みをつけて合算する
- 広告別なら信用スコアで補正する
- 2軸×4象限で優先順位を決める
「数字の見方」より難しいのは、「次の一手を決めること」です。
もし「このLP群、どこから改善すべきか分からない」「広告運用の優先順位を明確にしたい」とお悩みなら、お気軽にご相談ください。貴社の状況に合わせた加重スコア設計から、運用定着までサポートいたします。
関連リンク