SQL
SQLで普段からよく使う構文に「distinct」があります。distinctは重複したカラムを1つにして抽出する際に使う構文です。 例えば、どのユーザーが何の商品を買ったかが管理されているテーブルの場合、売れた商品の一覧や、購入したユーザーだけを抽出するなど…
例えば一人のユーザーが発行するクーポンが複数ある場合、それぞれが何回使ったのかをまとめて集計したいことがありますよね。全てのクーポンが5回以上使われているのかや、全てではないが1つはクーポンが5回以上使っているのかなどを集計するなど、そういう…
異なるテーブルを結合してデータを出す時に、必要になってくるのがJOIN(結合)です。SQLにはjoinやleft joinright joinなど様々な結合の仕方がありますが、joinの使い分け正しくできていますか? 結合の使い分けで大事なのはデータをどのように抽出したいか…
データの平均値や中央値を把握するは分析の基本 データ分析で最も多い依頼は、データの平均や中央値・頻出値、データの偏りがどれくらいあるかの把握です。 ユーザー別の売上平均や中央値、上位75%や25%がどれくらいなのかの四分位数(しぶんいすう)や、最…
SQLのLENGTH関数は、文字列の長さを取得するための非常に便利な関数です。このブログ記事では、具体的なテーブルを作成し、実際のクエリを例にとりながらLENGTH関数の使い方を説明します。 例えばメールアドレスの文字数で条件を絞りたいときや、ユーザーア…
SQLでWhere句を使って条件を絞り分析をしたい 今日はデータ分析で最も多く使われるWhere句の使い方を解説していきます。プロダクト開発や事業企画において、全てのデータの合計値や集計が必要なケースは多くありません。 購入単価を何円以上にするや、購入回…
先日公開した記事で、SQLを使った上位10件や上位N%のランキングを抽出するクエリを紹介しました その中で全体の10位ではなく、各グループ別で10位ずつ抜き出したいお問い合わせを頂いたので今回はグループ別に上位10件を抜き出すクエリを紹介していきます。 …
SQLはデータベースを操作するための言語です。初心者の方にとって、WITH句とサブクエリは難しい概念かもしれませんが、実際に使ってみると理解が深まります!本記事では、WITH句とサブクエリについてと、パフォーマンスなど使い分けのタイミング解説します。…
管理者に対して複数のユーザーが紐づくなど1:多のテーブルから特定のユーザーを抜き出したいケースなどあると思います。 そういう時は、同じテーブル内で自己結合を使うと特定のデータを抜き出すことができて便利です。 今回は自己結合を使った、1:多のテー…
「2:8の法則」をご存知でしょうか。顧客全体の2割である優良顧客が売上の8割をあげているという法則のことで、集団の売上・報酬・評価が一部の構成員に集中することを指します。イタリアの経済学者ビルフレッド・パレート(1848~1923)が1880年代の欧州の…
toCサービスやECサービスでプロダクトやマーケティングの施策を考える際、いかにリピートして購入してもらえるかが重要になります。リピートする顧客を特定する際に、購入周期や過去累積で購入していたのかを分析する必要があると思います。 今回はそんな購…
SQLが苦手な方にレクチャーしている時のことです。「SQLの英語がわかりにくい、構文が何をしているかイメージしづらいのでマッチングアプリで例えてほしい」と言われまして、例えてみたら思ったよりもしっくりきたのでブログに残そうと思います。 題して、初…
データ分析は、現代ビジネスにおいて欠かせないスキルの1つです。プロダクトマネージャーとして、製品の成功を決定づけるためには、正確なデータ分析が必要です。この記事では、駆け出しプロダクトマネージャーにとって重要なSQLとデータ分析のスキルについ…
目的 BigQueryでNULLや空白があるカラムをintに変換する方法 背景 BigQueryで、吐き出したいカラムがIntかNullのときCastしようとするとBad int64 valueのエラーが発生する 例えば、以下のようなJSONをRDB型式に吐き出したいとする。 { { id: 1, name: "トマ…