どうも405です。今日のPython 初心者ブログ⑬回目になります。今日は機械学習を勉強していました。どういう流れでどのような使い方が学べるのか楽しみです。
それにしても最近いい天気で、花粉症の自分にはしんどい季節になります。症状は目が痒くい程度なのですが、花粉専用の目薬何かないかな?と思う今日この頃です。
今日出てきた機械学習の単語
機械学習
データのパターンや特徴を学習し、それをもとに未知のデータに対して何かしらの予測を出力する。
Pythonのライブラリから
scikit-learn
最も一般的に知られている機械学習ライブラリ。今日勉強したサンプルとなるデータもそこから利用して使いました。(アヤメの花データ)
機械学習アルゴリズムや学習用の方法、データ整形処理の手法が沢山詰まっているみたいです。
Matplotlib
何回か出てきているグラフ描画の標準的なライブラリ。scatter関数を使って散布図を作りました。
Pandas
テーブルデータを取り扱うためのライブラリです。これも頻繫に出てきますね。
表計算から、統計量の算出、データ整形、csv等のさまざまなフォーマットでの入出力が出来ます。
機械学習で使われた用語(2月22日分)
特徴量
分析データの特徴を定量的に表現した数値
分析すべきデータや対象物の特徴・特性を、定量的に表した数値
予測や判断の精度を高めるためには、必要な特徴量のみを適切に選択することが重要となる
次元
特徴量の個数
そのまんまの意味だけど特徴量が3つあると、3次元となります。
適合率/精度
正と予測したデータのうち 実際に正であるものの割合?
システムが出した結果において、本当に正しかったものの割合?
いまいちわかっていません。
正解率
全ての予測に対する正答率
今日思ったこと
①番の工程が一番大事で時間が掛かると思いました。
機械学習をどんどん利用してより良い環境にしていきたい。
おまけ
漫画のお話なのですが、「宇宙兄弟」39巻の発売日でしたね。心の葛藤とか仲間を思う気持ち、心にしみました。良い作品は心に響きます。読んだことない方は是非。
横浜DeNAベイスターズの関根選手の話。結婚おめでとうございます!今年こそは、1番レギュラーで やらしいバッターと相手投手から思われるようにやっていきましょう。粘り強くを積み重ねていきましょう。
本日のささやかな幸せ。
「心に残る、作品を読む。」
今日はこのへんで以上です。
また明日。
コメント