書籍
書籍検索
新刊 送料無料

エンジニア入門シリーズ

―Pythonでゼロからはじめる―
AI・機械学習のためのデータ前処理[入門編]

著者: 北 研二・西村 良太・松本 和幸(徳島大学)
定価: 2,530円(本体2,300円+税)
判型: B5変型
ページ数: 154 ページ
ISBN: 978-4-904774-98-4
発売日: 2021/6/16
書籍内で使用されているプログラムはこちらにございます。

【目次】

1章 AI・機械学習における前処理

  1. 1.1 機械学習システムの構築
    1. 1.1.1 機械学習の例
    2. 1.1.2 機械学習システム構築の流れ
  2. 1.2 データの前処理
    1. 1.2.1 データの形式
    2. 1.2.2 データクリーニング
    3. 1.2.3 データ統合
    4. 1.2.4 スケーリング
    5. 1.2.5 特徴選択
    6. 1.2.6 次元削減
    7. 1.2.7 データ拡張

2章 Google Colabによる実行環境

  1. 2.1 Google Colabとは
    1. 2.1.1 Googleアカウントの取得
    2. 2.1.2 Google Colabへのアクセス方法
  2. 2.2 Google Colabの使い方
    1. 2.2.1 画面構成と各部の名称
    2. 2.2.2 初期設定
    3. 2.2.3 セルの操作
    4. 2.2.4 マークダウン
    5. 2.2.5 コマンド実行
    6. 2.2.6 仮想環境のスペック
    7. 2.2.7 フォーム
    8. 2.2.8 各種ライブラリの活用
    9. 2.2.9 代表的な行動のショートカットキー
    10. 2.2.10 コマンドパレット
  3. 2.3 ストレージ・データベースとの接続
    1. 2.3.1 ローカルファイルシステム
    2. 2.3.2 Google Drive
    3. 2.3.3 外部 (Web上) のデータ
    4. 2.3.4 Kaggle
  4. 2.4 GPUとTPUの利用
    1. 2.4.1 GPUとTPU
    2. 2.4.2 GPUの利用
    3. 2.4.3 TPUの利用
  5. 2.5 Google Colabのその他の設定
    1. 2.5.1 各種ライブラリのバージョン変更
    2. 2.5.2 新規ライブラリの追加
  6. 2.6 Pythonによるデータ処理
    1. 2.6.1 NumPy
    2. 2.6.2 pandas
    3. 2.6.3 scikit-learn
    4. 2.6.4 matplotlib
    5. 2.6.5 TensorFlow
    6. 2.6.6 Keras

3章 基本的な前処理技術

  1. 3.1 標準化と正規化
  2. 3.2 ビニング
  3. 3.3 外れ値
    1. 3.3.1 外れ値の検出と除去
    2. 3.3.2 四分位範囲を用いた外れ値に頑健な標準化
  4. 3.4 欠損値
    1. 3.4.1 欠損値の扱い
    2. 3.4.2 欠損値補完手法の比較
    3. 3.4.3 意味を持つ欠損値の扱い

4章 特徴選択と次元削減

  1. 4.1 特徴選択
    1. 4.1.1 フィルタ法
    2. 4.1.2 ラッパー法
    3. 4.1.3 正則化手法による特徴選択
  2. 4.2 次元削減
    1. 4.2.1 線形次元削減手法
    2. 4.2.2 非線形次元削減手法
    3. 4.2.3 そのほかの次元削減手法

【参考文献】

【口コミ】

  • ※口コミはありません。
ページトップへ戻る