未経験からデータサイエンティスト

未経験からデータサイエンティストの勉強したことの備忘録とか雑記とか

データ分析

機械学習による異常検知 2−1. 1変数正規分布

どうも、sue124です。今回は前回に引き続き書籍「入門 機械学習による異常検知」のことを書いていこうと思います。 今回は1変数の正規分布の場合の異常検知について、異常度の閾値設定するまでの数式導出と、それを使ったPythonでの異常検知をやっていきた…

機械学習による異常検知 1. 異常検知ことはじめ

どうも、sue124です。 久しぶりにブログを書いていこうと思います。今回は書籍「入門 機械学習による異常検知」をちょうど読み終わったので、この本をもとに「異常検知」に関して、自分が理解したことを備忘録的に書いていこうと思います。この本は、数式で…

Pythonで作った決定木のモデルを可視化する

こんにちは、sue124です。 前回は以下の書籍の写経を終えた感想を書きましたが、その中で本書の良くない点として挙げた「特に決定木のモデルの可視化が省略されている」ことに関して、自分でやり方を調べたので、書いていきたいと思います。今回は巷で良く使…

「Python実践データ分析100本ノック」をやり切った感想

こんにちは、sue124です。 また前回ブログを更新してから1ヶ月、その間に↓の書籍の写経をやり終えたので、今回はその感想(レビュー?)を書いていきたいと思います。 本書の良かった点 本に付いているサンプルデータを使ってとにかく手を動かして、Python…

pythonでpandas.DataFrameを結合する

「毎月記事を書く」宣言してから、1記事も書かないまま2月になっちゃいました。 今月は2記事書かなきゃ。 しばらくは下記書籍の勉強をしていく中で、初めて見たものを備忘録的に書いていきたいと思います。今回は分析対象のデータ(csv等)が複数のデータに散…