未経験からデータサイエンティスト

未経験からデータサイエンティストの勉強したことの備忘録とか雑記とか

「異常音検知の現状と展望」まとめ

先日産総研の第46回AIセミナー「AIによる音環境理解を目的とした環境音分析」というセミナーを受けたので、それに関してまとめます。 テーマは「異常音検知の現状と展望」です。

安定している大企業をやめてデータサイエンティストを志した経緯

こんにちは、sue124です。 この1月にデータサイエンティストへの転職を果たしましたので、今回は私がデータサイエンティストを志すようになった経緯を書いていきたいと思います。 1. 大企業に入った経緯 まずは大企業に入った経緯から書いていきたいと思い…

機械学習による異常検知 2−1. 1変数正規分布

どうも、sue124です。今回は前回に引き続き書籍「入門 機械学習による異常検知」のことを書いていこうと思います。 今回は1変数の正規分布の場合の異常検知について、異常度の閾値設定するまでの数式導出と、それを使ったPythonでの異常検知をやっていきた…

機械学習による異常検知 1. 異常検知ことはじめ

どうも、sue124です。 久しぶりにブログを書いていこうと思います。今回は書籍「入門 機械学習による異常検知」をちょうど読み終わったので、この本をもとに「異常検知」に関して、自分が理解したことを備忘録的に書いていこうと思います。この本は、数式で…

エントロピーとジニ不純度の比較

こんにちは、sue124です。 昔書いた「Python実践データ分析100本ノック」に関して書いた記事で、「決定木のモデル作成には平均情報量(エントロピー)を使っている」と書いたものの、書籍の中で使用している「sklearn.tree.DecisionTreeClassifier」のモジュ…

Pythonで作った決定木のモデルを可視化する

こんにちは、sue124です。 前回は以下の書籍の写経を終えた感想を書きましたが、その中で本書の良くない点として挙げた「特に決定木のモデルの可視化が省略されている」ことに関して、自分でやり方を調べたので、書いていきたいと思います。今回は巷で良く使…

「Python実践データ分析100本ノック」をやり切った感想

こんにちは、sue124です。 また前回ブログを更新してから1ヶ月、その間に↓の書籍の写経をやり終えたので、今回はその感想(レビュー?)を書いていきたいと思います。 本書の良かった点 本に付いているサンプルデータを使ってとにかく手を動かして、Python…

決定木でのモデル作成の仕組み

引き続き下記書籍でPythonでのデータ分析についてを勉強しているsue124です。 今回は第5章で使った決定木でのモデル作成についてです。 サンプルコードをそのまま写せばサンプルデータの決定木モデルを作ることができましたが、その仕組みの解説はなかったた…

pythonでpandas.DataFrameを結合する

「毎月記事を書く」宣言してから、1記事も書かないまま2月になっちゃいました。 今月は2記事書かなきゃ。 しばらくは下記書籍の勉強をしていく中で、初めて見たものを備忘録的に書いていきたいと思います。今回は分析対象のデータ(csv等)が複数のデータに散…

2020年の目標

2020年に入って半月以上過ぎてしまいましたが、まだ今年の目標をたててなかったので、ここに書いていきたいと思います。 ・ブログを月1回以上更新する 「教えることは、二度学ぶことである」という言葉を見習って、人に教えるつもりで勉強したことを書いてい…

ブログ始めました

このブログでは何か面白いことをしたくてプログラミング勉強中の筆者が、勉強したことを書いていきたいと思います。 ひとまずは ・Pythonでのデータ分析 ・ラズパイでのカメラを動かす とかをやっていく予定です。 具体的なことは追々書いていこうと思います…