Pythonによるデータサイエンス&機械学習コース
1. Pythonでグラフ
- データ可視化の基礎
- 日経平均株価データの可視化
- UKガスデータの時系列プロット
- ファイル: YANG GUANGZE(1).ipynb
2. データ種類・基礎統計量
- データの種類と特徴
- 記述統計量の計算
- 顧客・売上・ブランドデータ分析
- ファイル: YANG GUANGZE(2).ipynb
3. 確率分布・区間推定
- 確率分布の理論と実装
- 信頼区間の計算
- ファイル: YANG GUANGZE(3).ipynb
4. 仮説検査
- 統計的仮説検定
- t検定、カイ二乗検定
- ファイル: YANG GUANGZE(4).ipynb
5. 回帰分析
- 単回帰分析の理論と実装
- 最小二乗法
- ファイル: YANG GUANGZE(5).ipynb
6. 重回帰分析
- 多変量回帰モデル
- 変数選択手法
- ファイル: YANG GUANGZE(6).ipynb
7. 主成分分析
- 次元削減手法
- PCAの理論と実装
- ファイル: YANG GUANGZE(7).ipynb
8. 判別解析
- 線形判別分析
- 分類問題への応用
- ファイル: YANG GUANGZE(8).ipynb
9. クラスター分析
- k-means法
- 階層クラスタリング
- ファイル: YANG GUANGZE(9).ipynb
10. K近傍法
- k-NN分類・回帰
- 距離尺度の選択
- ファイル: YANG GUANGZE(10).ipynb
11. ニューラルネットワーク・決定木
- 多層パーセプトロン
- 決定木アルゴリズム
- ファイル: YANG GUANGZE(11).ipynb
12. 集団学習
- アンサンブル学習
- バギング・ブースティング
- ファイル: YANG GUANGZE(12).ipynb
13. Kaggle実践
- Kaggleコンペティション参加
- 実データでの機械学習
- ファイル: YANG GUANGZE(13).ipynb
14. 機械学習モデルの改善
- ハイパーパラメータチューニング
- モデル評価・改善手法
- ファイル: YANG GUANGZE(14).ipynb
15. 最終レポート
- 総合的な機械学習プロジェクト
- メインファイル: YANG GUANGZE(最終レポート).ipynb
総合的な機械学習プロジェクトとして、複数のアルゴリズムを比較検討し、最適な予測モデルを構築。
Machine-Learning-Course/
├── code/
│ ├── 1/ - 15/ # 各章のコードとデータ
│ └── ... # Jupyter Notebook形式
└── README.md # このファイル
- 言語: Python
- 主要ライブラリ:
- NumPy, Pandas (データ処理)
- Matplotlib, Seaborn (可視化)
- Scikit-learn (機械学習)
- TensorFlow/Keras (深層学習)
本コースでは、データサイエンスと機械学習の基礎から応用まで、実践的なPythonプログラミングを通じて学習します。