こんばんわ!
前回の記事で取り上げていたkaggleの「タイタニックの生存者予測」について書いて行こうと思います。
www.kaggle.com
とりあえず、csvデータを読み込んで、データ形式を確認します。
とりあえず、”Name”,"Ticket","Cabin", "Embarked"は不要なので削除します。
"Sex"をLabelEncoderで文字データを数値化します。
scikit-learn.org
その後、"Age"と"Fare"のnaを平均値で埋めておきます。
今日はここまで!
明日からは分類機でモデル作成→予測まで行ってみます(-。-)y-゜゜゜
ご購読ありがとうございました(^^)/