心に栄養を。機械学習と花粉と私。

どうも405です。今日のPython 初心者ブログ⑬回目になります。今日は機械学習を勉強していました。どういう流れでどのような使い方が学べるのか楽しみです。

それにしても最近いい天気で、花粉症の自分にはしんどい季節になります。症状は目が痒くい程度なのですが、花粉専用の目薬何かないかな?と思う今日この頃です。

今日出てきた機械学習の単語

機械学習
データのパターンや特徴を学習し、それをもとに未知のデータに対して何かしらの予測を出力する。

Pythonのライブラリから

scikit-learn
最も一般的に知られている機械学習ライブラリ。今日勉強したサンプルとなるデータもそこから利用して使いました。(アヤメの花データ)
機械学習アルゴリズムや学習用の方法、データ整形処理の手法が沢山詰まっているみたいです。

Matplotlib
何回か出てきているグラフ描画の標準的なライブラリ。scatter関数を使って散布図を作りました。

3品種のアヤメの分布図

Pandas
テーブルデータを取り扱うためのライブラリです。これも頻繫に出てきますね。
表計算から、統計量の算出、データ整形、csv等のさまざまなフォーマットでの入出力が出来ます。

機械学習で使われた用語(2月22日分)

特徴量
分析データの特徴を定量的に表現した数値
分析すべきデータや対象物の特徴・特性を、定量的に表した数値
予測や判断の精度を高めるためには、必要な特徴量のみを適切に選択することが重要となる

次元
特徴量の個数
そのまんまの意味だけど特徴量が3つあると、3次元となります。

適合率/精度
正と予測したデータのうち 実際に正であるものの割合?
システムが出した結果において、本当に正しかったものの割合?
いまいちわかっていません。

正解率
全ての予測に対する正答率

今日思ったこと
①番の工程が一番大事で時間が掛かると思いました。
機械学習をどんどん利用してより良い環境にしていきたい。

おまけ

漫画のお話なのですが、「宇宙兄弟」39巻の発売日でしたね。心の葛藤とか仲間を思う気持ち、心にしみました。良い作品は心に響きます。読んだことない方は是非。

横浜DeNAベイスターズの関根選手の話。結婚おめでとうございます!今年こそは、1番レギュラーで やらしいバッターと相手投手から思われるようにやっていきましょう。粘り強くを積み重ねていきましょう。

本日のささやかな幸せ。
「心に残る、作品を読む。」

今日はこのへんで以上です。
また明日。

コメント

タイトルとURLをコピーしました