機械学習でタイタニック号の生存者を予測する。同じ40歳でも、金持ち女性は生き残れたけど、労働階級男性は死亡!悲しいけど、これが現実なのよね…。

機械学習でタイタニック号の生存者を予測する。同じ40歳でも、金持ち女性は生き残れたけど、労働階級男性は死亡!悲しいけど、これが現実なのよね…。

機械学習のhello,worldプログラミング(アヤメの品種を推測する。4つのデータの組み合わせから)

参考URL
https://www.tsone.co.jp/tech-blog/archives/1320#titanic-dataset

1, タイタニック号の乗客データを取得して、表示

1309名の乗客データがあるらしい。多すぎるとprintは省略されるのか?

2, 項目と欠損値を確認

3, 欠損値を保管する・文字データを数値化する

だいぶパラメータが減った。

4, 30%を学習用データに、70%を検証用データにしてみたら、正解率は81.6%(0.816793893129771)

5. 適当な人物データを、学習済みモデルに渡して、生存出来たかを推測させてみる
同じ40歳でも、金持ち女性は生き残れた(1)けど、労働階級男性は死亡!(0)
悲しいけど、これが現実なのよね…。