データサイエンスビジネス分析テクニック理論解説

ビジネスマンが絶対理解できる「モデリング」の話【数式を使わない用語解説】

分析テクニック

データ分析で用いられる「モデリング」とは、結果がどうなるかについて答えが得られるようなモデルを作ることであり、ここでいう「モデル」とは、データから作った方程式、法則のようなものです。

ものすごく平たく言えば、「とにかく簡素化して、法則を見つけて作りましょう」ということです。

今回は身近な例をあげながら、特にビジネスデータ活用で必ず役に立つ形で理解できるよう、解説を行います。

「モデリング」「モデル」とは?

「モデリング」という言葉自体は色々なジャンルで使われており、例えばデータ解析では「統計モデリング」の中に「一般化線形モデル」「階層ベイズモデル」等があります。他には心理学やコンピュータグラフィックスなんかでも出てくるようです。

モデリング・モデルその言葉自体の定義は先ほど説明した通りではありませんが、あくまでビジネスデータ活用に役立つような解釈を考えたとき、

くらいのイメージで捉えていただければ良いかと思います。

 

実際のCMから「モデリング」を体感する

早速、実戦してみましょう。

まず、次の2つのCM(各15秒)について考えてみます。

 

CM① 「Cloud CIRCUS(クラウドサーカス)」TVCM「やってみなサーカス 運用簡単」篇 15秒

 

CM② CM【elgana(エルガナ)】働き方アップデート篇

(2021/01/28現在、同じ日に両方ともTVで見ました)

 

この2つのCMに、「共通点・パターン」があったはずです。

【共通点】
・オフィス
・何か困っていた、心配事があった様子
・いきなり女性タレントが出てきた
・商品紹介
【パターン】
サラリーマンが困っている→いきなり女の子登場「これなら解決」→商品紹介→おしまい

多少の差異はあれど、このようになりました。

 

これで、モデリング完了です。【オフィスツールCMモデル】が完成しました。

 

ここで行った「【共通点】の書き出し」「【パターン】の組み立て」は、

【共通点】の書き出し=必要な情報の整理、使えそうなデータの取捨選択
【パターン】の組み立て=整理した情報から「たぶんこうだろう」という法則を組み立ててみた

という作業であり、これはビジネスデータ分析で行っていることそのものになっています。

 

ビジネスとモデリング

モデリングを行う利点は、『目の前の情報をとにかく簡素化していることから、本質に近づくことができる』という点に尽きます。

ビジネスデータ分析の場合、もしこのCMがものすごく効果的であれば、「効果的なCMの法則を見つけた」ということになり、この法則をビジネスに活かすことができるのです。

データ分析の場合、今回でいうところの【パターン】を数式で表すことがほとんどです。ただ、それは様々なデータを文字式に置き換えているだけであり、全体像としては何も変わりありません。

今回のCM考察は、ニュアンス的には「推理」に近い内容でした。(参考:データ分析業務のいろいろな例え

データ分析自体の目的の理解とともに、「モデリング」の身近さを感じていただければ幸いです。

 

(おまけ)今回のCMを無理くり数式で表現してみる

思いつきで作ったので、間違っても参考にしないでください。(もはや趣味の世界)

 

【初級】

$$ CMの魅力度=(1.5Office+1.0Worry+5.0Girl)*Info $$
・$Office$(会社)、$Worry$(心配事)、$Girl$(女性タレントかどうか:0 or 1)は加算=どれかが欠けてもCMとして成り立つ
・もし$Info$(商品紹介)が$0$なら、全体として$CM=0$…CMとしての意味なし

 

【中級】

$$ CMの平均魅力度 = \frac{1}{n} \sum_{i=0}^n \left[ \{0.7Office+0.3Worry+(1-0.4Girl)*Charm+u_i \}*Info \right] $$
・CMを見た$n$人の平均をとる
・$(1-0.4Girl)$…「女性タレント、男性タレント」の基本係数がそれぞれ「$0.6$、$0.4$」とする
(起用タレントが女性だと少しCM魅力度が上がる、ということを数値で表す)
・$Charm$(タレントの魅力)…$0.00$~$1.00$($0$~$100$%)で表現
・$Office$と$Worry$の重要度は$7$:$3$で按分、とする
・$u_i$…誤差項

 

【上級】
個人個人のタレントへの好感度を正規分布に従う誤差といて組み込み、中身を正規化して確率で表現し、$n→∞$で極限をとってそのCMを見た人の購入確率を…とか考えましたが、想像に体力が追いつかないのでこの辺にしときます。

 

・・・結局のところ、いろんな情報を入れ込もうとすると数式はややこしくなりますが、「案外シンプルなことしか書いてないこともあるよ」ということで。

 

【今回の記事に関連するオススメ書籍】

その問題、数理モデルが解決します 社会を解き明かす数理モデル入門 [ 浜田 宏 ]

価格:2,090円
(2021/2/2 21:58時点)
感想(0件)

その問題、やっぱり数理モデルが解決します データ時代を生き抜くための数理モデル入門 [ 浜田 宏 ]

価格:2,090円
(2021/2/2 21:59時点)
感想(0件)

データ分析のための数理モデル入門 本質をとらえた分析のために [ 江崎貴裕 ]

価格:2,860円
(2021/1/31 22:40時点)
感想(2件)

コメント

タイトルとURLをコピーしました