機械学習実践コース 2日目

https://www.kikagaku.co.jp/seminars/machinelearning/www.kikagaku.co.jp
 DX人材育成を目的とした社内学校(社内研修制度)。その一環で、昨日からキカガクと言う会社の「機械学習実践コース」と言う研修を受講。3日間中2日目。

  • NumPy:科学技術計算用、多次元配列を扱えるため機械学習分野でよく使用される。
  • Pandas:データの読み込みや並べ替え、統計量やグラフ化などのデータ操作。
  • Matplotlib・Seaborn:描画用モジュール。棒グラフや折れ線グラフ、3D グラフなどの作成。

 主に使うPythonのモジュールはこの辺4つ。
 昨日、今日と、「教師あり学習」を中心に学び、「重回帰分析」に必要なデータの前処理や標準化、モデルの選択、そして評価と進んでいく。これの繰り返し。
 この研修、何より学習プラットフォームになっている「Google Colaboratory」が無料で使えていることがすごい。こういう学習(または実業務)が、その気なら無料でできると言うことになる。この研修だって、カリキュラム資料の準備があるとはいえ、研修費用も抑えられるだろう。ちなみに、本研修は税込110,000円。VMwareCisco関連の研修は300,000円以上が当たり前で*1、環境代も相当かかってそうだったと思うだけに、時代の変化を感じてならない。
 今日までで教師あり学習の回帰・分類が完了。途中、先日も似たような研修を受講をした際に出た、アイリス(Iris)の分類なんかもお題に出てきた*2。他にもボストン(アメリカ合衆国の都市)の家賃データ予測や、自動車の販売額予測、保険料の請求額予測と言うお題も出てきた。おそらくアイリス同様、機械学習における定番のネタなんだろう。
 2日目になってくると、自身の判断で欠損データの処理が必要だったり、モデル評価可能な形に加工をしたりする必要が出てきた。難しいと言うよりも、本当にどれがいいのか分からないというモヤモヤ感がある。この辺が経験によるカンが必要になってくるのだろう。
 なんとか乗り切れた2日目。若干疲れ気味。さて、最終日までちゃんとついていけるのか。三十路新米プログラマは不安いっぱいだ。

*1:試しに調べたところ、伊藤忠テクノソリューションズ社主催の「VMware vSphere: Install,Configure,Manage [V7.0]」研修で税込484,000円、トレノケート社主催の「Implementing and Administering Cisco Solutions (CCNA) v1」で税込330,000円。詳細は以下参照。 www.school.ctc-g.co.jp www.trainocate.co.jp

*2:先日の類似研修は以下参照。 m-i-5.hatenablog.com