現役エンジニアの技術ブログ

東北でエンジニアをしている26歳です。C/Python,機械学習,趣味はQiitaの記事漁り,アプリ開発挑戦中

【Kaggle】Titanic-2 データ整形~提出

こんばんわ!

 

だいぶ時間が空いてしまいましたが、Kaggleの記事を書いて行こうと思います。

前の記事:

comet-tec.hatenablog.com

 

 

前回はcsvの読み込み~カラムの抽出まで行ったので、今回はデータの整形~提出まで行います。

 

データの整形部分

>|python|

data_X["Sex"]=le.fit_transform(data_X["Sex"])
data_X["Age"]=data_X["Age"].fillna(value=data_X["Age"].median())
data_X["Fare"]=data_X["Fare"].fillna(value=data_X["Fare"].median())
data_X["Embarked"]= data_X["Embarked"].fillna('S')
data_X.loc[data_X["Embarked"] == 'S', "Embarked"] = 0
data_X.loc[data_X["Embarked"] == 'C', "Embarked"] = 1
data_X.loc[data_X["Embarked"] == 'Q', "Embarked"] = 2

#Test Data fill 
data_y["Sex"]=le.fit_transform(data_y["Sex"])
data_y["Age"]=data_y["Age"].fillna(value=data_y["Age"].median())
data_y["Fare"]=data_y["Fare"].fillna(value=data_y["Fare"].median())
data_y.loc[data_y["Embarked"] == 'S', "Embarked"] = 0
data_y.loc[data_y["Embarked"] == 'C', "Embarked"] = 1
data_y.loc[data_y["Embarked"] == 'Q', "Embarked"] = 2
||<

整形内容は"Sex"のデータを"male"→0,"female"→1に変換しています。

今回は、線形回帰分析で生存率を求めるので、データ型を質的データから量的データに変更する必要があります。

次に"Age"と"Fara"ので空白データを平均値で埋めます。

最後に"Embarked"を量的データに変換しました。

 

次に、モデル作成

> |python|

input_cols=['Sex', 'Age', 'Pclass','SibSp', 'Parch', 'Fare','Embarked']
output_cols=['Survived']
X=data_X[input_cols]
y=data_X[output_cols]

X1=data_y[input_cols]

clf.fit(X,y)
pred=clf.predict(X1)

||<

必要なカラムを抜き出し、モデルを作成しました。

 

最後に、予測データを整形し、提出します。

 

f:id:Comet_tec:20210927194032p:plain

Score 0 ってまじかよ(T_T)

 

明日は高精度化に挑戦します!

 

今日はここまで!

ご購読ありがとうございました!

 

ビジネスマンの入門書(ビジネスマンの父より息子への30通の手紙 キングスレイ・ウォード著)

こんばんわ!

 

今回は、最近読んだ本で一番ためになった本の書評を書いて行こうと思います。

 

今回読んだ本は、「ビジネスマンの父より息子への30通の手紙」(キングスレイ・ウォード著)です。

ビジネスマンの父より息子への30通の手紙 新潮文庫

 

キングスレイ・ウォード氏は、会計事務緒に勤めた後、経営者に転身し、製薬会社を中心に複数の企業を経営しています。

 

今回の「ビジネスマンの父より息子への30通の手紙」は、ウォード氏がこれから会計士として独立する息子に対して、自身の経験と知識からビジネスマンとしての心構えや落とし穴への注意書きなどを手紙形式で綴っています。

 

ビジネスマンとして、ビジネスパートナーとの接し方や株を運営する上での注意点など綴られており、とても勉強になる本でした(∩´∀`)∩

 

また、ウォード氏の経験も踏まえてアドバイスされており、読み物としても面白いです!

 

ビジネスマンって色々なスキルが求められて大変だよね(-。-)y-゜゜゜

 

今日はここまで!

ビジネスマンの父より息子への30通の手紙 新潮文庫

 

ご購読、ありがとうございました!

焼酎にチャレンジ【だれみや 甕雫】

こんばんわ!

 

週末には少し早いですが、気になった焼酎を購入しました!

 

だれみやさんの「甕雫」

www.dareyami.jp

 

amazonの評価が高いので、ついポッチてしまったのですが、週末が楽しみです(∩´∀`)∩

京屋酒造 甕雫 かめしずく 20度 900ml

味のレビューは届いてからで!

 

ものすごい短いですが、今日はここまで!

 

ご購読、ありがとうございましたm(__)m

 

 

タイタニックの生存者予測【Kaggle】-1

こんばんわ!

 

前回の記事で取り上げていたkaggleの「タイタニックの生存者予測」について書いて行こうと思います。

www.kaggle.com

 

とりあえず、csvデータを読み込んで、データ形式を確認します。

f:id:Comet_tec:20210831225038p:plain

1

 

 

とりあえず、”Name”,"Ticket","Cabin", "Embarked"は不要なので削除します。

"Sex"をLabelEncoderで文字データを数値化します。

 

scikit-learn.org

 

その後、"Age"と"Fare"のnaを平均値で埋めておきます。

f:id:Comet_tec:20210831225707p:plain

2

 

 

今日はここまで!

 

明日からは分類機でモデル作成→予測まで行ってみます(-。-)y-゜゜゜

 

 

 

ご購読ありがとうございました(^^)/

タイタニックの生存者予測【Kaggle】

こんばんわ!

 

会社提携の機械学習勉強サイトから、次のステップとしてKaggleに励んでおりますが、Kaggleの登竜門である「タイタニックの生存者予測」に苦戦しています・・

www.kaggle.com

 

日本語解説をしてくれている方々のコードを見ていますが、なかなか難しい(-。-)y-゜゜゜

 

とりあえず一日一時間はKaggleに取り組む習慣をつけていこうと思います!

 

今日はここまで!

 

上司に人格を期待するのは間違いなのか?【書評】「悪いヤツほど出世する」 ジョフリー・フェファー著

こんばんわ!

 

読書に夢中で更新を忘れていました。。。。

 

 

今回読んだ本は、「悪いヤツほど出世する」( ジョフリー・フェファー著)です!

悪いヤツほど出世する (日本経済新聞出版)

 

ジョフリー・フェファーは、スタンフォード大学ビジネススクールで教鞭を取っている組織行動学者です。

 

この本では、これから管理職になる人が持ちがちなリーダーシップ神話(リーダーは人格が良く、部下の面倒をみる)について徹底的に否定してくれます。

 

会社の中で、成果が出やすい人の特徴として、ナルシスト型(自信過剰)な人が多く、実際にその人に実力が無くても自信アリアリな態度によって評価が上がってしまう傾向にあるようです。

このような人物が上司になってしまった場合、部下の成果を横取りしたり、適切な人事評価を行わずに不幸になってしまうことが示されています。

 

また、実際の人物の例として、アップルのスティーブ・ジョブズドナルド・トランプが挙げられています。(ジョブズのアップル社での横暴っぷりは有名ですね)

 

自分の周りの上司は、良い人達が多いので恵まれてるなと思いました。(-。-)y-゜゜゜

 

今日はここまで!

 

 

【技術メモ】Pythonの開発環境構築とJupiterNotebookでのコーディング

こんばんわ!

 

 

 

最近、会社から提供して頂いている機械学習講座をやり込んでいるのですが、

自分のPCで機械学習を行う開発環境を整えておらず、

この際にブログに書き起こしておこうと思い、書き始めました!

 

この記事では、Pythonの開発環境(Anaconda3)とJupiter notebookでの開発手順について、記載します。

 

www.anaconda.com

 

jupyter.org

 

Anacondaの導入

Anaconda3の導入方法から始めていきます。

以下のURLにアクセスし、各PCの環境に合わせてDLするInstallerを選択します。

www.anaconda.com

 

f:id:Comet_tec:20210810200641p:plain

 

Anaconda3 Installerの起動

 DLしたAnaconda3のInstallerを起動します。

f:id:Comet_tec:20210810200824p:plain

Anaconda3 Installer起動画面

 

「Next」を選択し、「I Agree」を選択します。

f:id:Comet_tec:20210810200912p:plain

 

「Just Me」を選択します。

f:id:Comet_tec:20210810201021p:plain

 

 

保存するフォルダーを選択します。

f:id:Comet_tec:20210810201258p:plain

フォルダー

Optionは両方を選択します。

f:id:Comet_tec:20210810201333p:plain



Installが始まるので、完了まで待ちます。(約5分)

f:id:Comet_tec:20210810203406p:plain



 

Installが完了したら、「Finish」を選択します。Anaconda3のInstallは以上です。

f:id:Comet_tec:20210810201535p:plain

 

Jupiter notebookの起動方法

jupiter notebookには、2通りの起動方法があります。

1つは、Anaconda Navigatorから起動する方法。

2つ目は、コマンドプロンプトから起動する方法。

今回は、Anaconda Navigatorから起動する方法を紹介します。

 

Anaconda Navigetorを起動し、Jupiter notebookの「Launch」を選択します。

f:id:Comet_tec:20210810202033p:plain

Anaconda Navigator

 

選択すると、Jupiterのページに飛ばされます。

 

Jupiter notebook 開発開始手順

Jupiter noteboookの「New」を選択し、「Python3」を選択します。

f:id:Comet_tec:20210810202142p:plain

 

コードを書き込める欄が出てくるので、コードを書き込んで「Run」を選択すると、コードが実行されます。

f:id:Comet_tec:20210810202419p:plain

 

締め

以上が、Python開発環境の導入についての説明と開発開始の方法になります。

初期設定だと「matplotlib」の軸名の設定などに日本語を使用した場合、文字化けしてしまうケースがあるので、別途設定が必要なようです。

※matplotlib : グラフを書いてくれる便利なライブラリ。変数の相関や時系列データを見る時に大活躍です。

 

今回は、目次と画像を入れてみましたが、画像が結構大きく表示されるみたいですね(-_-;)

 

今までは、VS CodeでPytonを書いていたのですが、Jupiter notebookの方が書きやすいですね!

AtCodeやKaggleでPythonでコーディングする時はこっちを使おうと思います。

 

今日はここまで!

 

ご購読いただき、ありがとうございました(^^)/