決定木の作り方
このセクションでは、決定木分析を正しく可視化させる書き方 を3 ステップでご紹介していきます。
1. 主となる決定から始めます。この点を示す小さなボックスを描画し、ボックスから右側へ線を引いて考えうる解決策やアクションへとつなげます。適宜ラベルを付けます。
2. 確率ノードと決定ノードを追加し、以下のように木を展開していきます。
- 決定がもう1つ必要な場合には、ボックスを追加します。
- 結果が不明確な場合には、丸を描画します (丸は確率ノードを表します)。
- 問題が解決した場合には、(とりあえず) 空白のままとします。
各決定ノードから想定しうる解決策を描き、各確率ノードからは想定しうる結果を示す線を描きます。選択肢を数値的に分析する場合には、各結果の確率と各アクションの費用も含めます。
3. それぞれの線が終点に到達するまで展開を続けます。終点とは、すべき選択や考慮すべき結果がなくなった点を指します。その後、想定しうる結果のそれぞれに値を割り当てます。値としては、抽象的なスコアやまたは金融資産の価値などが考えられます。終点を示す三角形を追加します。
このステップだけで、決定木が完成し、すべき決定について分析する準備が整いました。
決定木とは?
決定木とは、英語で(Decision Tree・ディシジョンツリー・デシジョンツリー)と呼ばれており、一連の関連する選択の想定しうる結果を可視化させた分析です。個人や組織が、コスト、可能性や利点を比較して取りうるアクションを評価する上で有用な図です。非公式な議論を促進したり、数学的に最善の選択を計算するアルゴリズムを図式化したり、さまざまな用途に利用できます。
決定木は通常、1つのノードから始まり、想定しうる結果へと分岐していきます。これらの結果はそれぞれ、他の可能性へと分岐する追加のノードへとつながります。結果として、木のような形が形成されます。
ノードには、確率ノード、決定ノードと終了ノードの3種類があります。確率ノードは丸で示され、特定の結果の可能性を表します。正方形で示される決定ノードはすべき決定を表し、終了ノードは決定のパスの最終的な結果を示します。
多くの人に馴染みがあり、比較的わかりやすいフローチャート記号で決定木を作成することも可能です。
覚えておきたい決定木の種類
- 分類木 - 分類木は、データセット内の観測値を目的変数の値に分類するためのモデルです。各ノードでデータを分割し、その分割に基づいて目的変数を予測します。
- 回帰木 - 回帰木は、目的変数が連続値である場合に使用される決定木の一種です。回帰木は分類木と同じく、各ノードでデータを分割し、その分割に基づいて目的変数の値を予測します。
- アンサンブル学習 - 複数のモデルを組み合わせて単一の予測モデルを構築する手法です。個々のモデルが弱学習器として知られる場合、そのアンサンブルは強力な予測能力を持つことがあります。
- ランダムフォレスト - アンサンブル学習の一形態であり、複数の決定木を使用して予測を行います。個々の決定木は、データのランダムなサブセットでトレーニングされ、予測結果はそれらの木の平均または多数決に基づいて行われます。ランダムフォレストは、過学習を抑制し、高い予測性能を提供することができます。
決定木分析のメリット
意思決定を迫られる機会は多いものです。企業が誤った意思決定を行うと、財務上の損失、リソースの不適切な使用、企業イメージの悪化など、手痛い失敗を招く可能性があります。ここで役立つのが決定木です。将来を占うことはできませんが、正しい方向へ進むための価値ある洞察が得られる図です。
決定木は以下のように多くのメリットがあります:
- 決定木は理解しやすい
- 感情を交えることなく状況を俯瞰できる
- 具体的なデータの有無にかかわらず利用でき、データの準備が最小限で済む
- 既存の木(ツリー)に新しいオプションを追加できる
- いくつかの選択肢から最善のものが選べる
- 他の意志決定支援ツールと組み合わせやすい
メリットが多いため、決定木は戦略立案、調査内容の分析や結論の導出を目的としてビジネスの現場でよく使われます。融資者や銀行は、融資や投資機会のリスク算定のために決定木を使用しています。インフォグラフィックにもしばしば使われ、雑誌に掲載されたり、SNSで共有される例も数多くあり、あらゆる問いや懸念事項の検討と想定しうる結果の視覚化に応用できる図が決定木です。
決定木・ディシジョンツリーの記号一覧
図形 | 名称 |
---|