BigQuery ML(Machine Learning)のチュートリアルをやってみる
Google Analytics 4(GA4)のデータを機械学習で活用したいと調査しているときの覚書。
1.機械学習とは?
機械学習とは、過去のデータから自動的にパターンやルールを学習することで何らかのタスクをこなす技術。
実世界の複雑に絡み合う事象から法則を見つけ、予測や課題解決につなげることができる。
Googleデジタルワークショップの教材が分かりやすい。
参考: 機械学習の基礎 - Google Digital Workshop (デジタルワークショップ)
2.GA4のデータをBigQueryへエクスポート
GA4のデータは14ヵ月しか保存されない。
参考: データの保持 - アナリティクス ヘルプ
過去のデータをBigQueryに簡単に保存する仕組みはないので、データ分析として利用する場合はBigQueryにエクスポートしておく必要がある。
(API経由でプログラムを組めば多分出来る)
前の記事を参考に: Google Analytics4とBigQueryを接続して生データを確認する
3.BigQuery MLとは?
BigQueryのデータを用いて簡単に機械学習(Machine Learning)モデルを作成し、実行できるサービス。
プログラミングの必要なくSQL言語だけで実行できる。
4.BigQuery MLのチュートリアル
まずは大人しく公式サイトのクイックスタートをやってみる。
サンプルがGoogleアナリティクスのデータなのでちょうどよさそう。
注意事項など
- ロケーションタイプはマルチリージョン
- sample_modelを生成するのに3分 16秒掛かった。
分類子とか意味不明。
とりあえずチュートリアルを終わっても分かった気がしない。
ページ下部のリンクにあった機械学習集中講座をやってみることにした。
【関連記事】
- Google Analytics(GA4)はデータ保存、可視化するのはLooker Studioの役目。
- Google Analytics4とBigQueryを接続して生データを確認する
- 機械学習プロジェクトの進め方:CRISP-DM