サンプルコ?ド 「Kaggleで勝つデ?タ分析の技術」( amazon ) のサンプルコ?ドです。 各フォルダの?容 フォルダ ?容 input 入力ファイル ch01 第1章のサンプルコ?ド ch02 第2章のサンプルコ?ド ch03 第3章のサンプルコ?ド ch04 第4章のサンプルコ?ド ch05 第5章のサンプルコ?ド ch06 第6章のサンプルコ?ド ch07 第7章のサンプルコ?ド ch04-model-interface 第4章の「分析コンペ用のクラスやフォルダの構成」のコ?ド 各章のディレクトリをカレントディレクトリとしてコ?ドを?行して下さい。 第1章のタイタニックのデ?タは、 input/readme.md のとおりダウンロ?ド下さい。 第4章の「分析コンペ用のクラスやフォルダの構成」のコ?ドについては、 ch04-model-interface/readme.md を?照下さい。 Requirements サンプルコ?ドの動作は、Google Cloud Platform(GCP)で確認しています。 環境は以下のとおりです。 Ubuntu 18.04 LTS Anaconda 2019.03 Python 3.7 必要なPythonパッケ?ジ(下記スクリプト?照) 以下のスクリプトのとおりにGCPの環境構築を行っています。 # utils ----- # 開?に必要なツ?ルをインスト?ル cd ~/ sudo apt-get update sudo apt-get install -y git build-essential libatlas-base-dev sudo apt-get install -y python3-dev # anaconda ----- # Anacondaをダウンロ?ドしインスト?ル mkdir lib wget --quiet https://repo.continuum.io/archive/Anaconda3-2019.03-Linux-x86_64.sh -O lib/anaconda.sh /bin/bash lib/anaconda.sh -b # PATHを通す echo export PATH=~/anaconda3/bin:$PATH >> ~/.bashrc source ~/.bashrc # python packages ----- # Pythonパッケ?ジのインスト?ル # numpy, scipy, pandasはAnaconda 2019.03のバ?ジョンのまま # pip install numpy==1.16.2 # pip install scipy==1.2.1 # pip install pandas==0.24.2 pip install scikit-learn==0.21.2 pip install xgboost==0.81 pip install lightgbm==2.2.2 pip install tensorflow==1.14.0 pip install keras==2.2.4 pip install hyperopt==0.1.1 pip install bhtsne==0.1.9 pip install rgf_python==3.4.0 pip install umap-learn==0.3.9 # set backend for matplotlib to Agg ----- # GCP上で?行するため、matplotlibのbackendを指定し直す matplotlibrc_path=$(python -c "import site, os, fileinput; packages_dir = site.getsitepackages()[0]; print(os.path.join(packages_dir, 'matplotlib', 'mpl-data', 'matplotlibrc'))") && \ sed -i 's/^backend : qt5agg/backend : agg/' $matplotlibrc_path