ググった事無い人っているのかな?

備忘録

統計学のことについて自分が思っていることを書いていきます

なぜ必要と思っているか?

今、携帯を持っていない人は何人ぐらいいるのだろうか?
Google検索したことないひとは何人ぐらいいるのだろうか?

そう考えるとIT技術を使ってデータが往き来されていると考えられる。
そのデータが大量に集まってビッグデータとなり、そのデータを使って統計の知識を使用して分析し、新しいサービスを生んだり、未来に役立てていけるはずだ。

データは21世紀の刀、データ分析ができる人は21世紀のサムライ Google 元CEO エリック・シュミット

この言葉を見て自分も統計に興味を持ってきた。
ここからは色んな本を読んで気になった所を備忘録として残しておく。何かの参考になれば幸いです。 読んだ本「こども統計学 なぜ統計学が必要なのかがわかる本」から

以下と未満の違い

基準になる数を含む 以下と以上
基準になる数を含まない 未満と超

A<B AはBより小さい(Bを含まない、AはB未満)
A≦B AはBより小さい(Bを含む、AはB以下)

「平均値」「中央値」「最頻値」

全ての数値を足して数値の個数で割った値が「平均値」
大きさ順に並べた真ん中が「中央値」
データの中で最も多く出現している値「最頻値」

平均はみんなの「真ん中」ではない

「平均値」と「中央値」が大きく異なる場合は、「外れ値」があるかもしれない。他の値から大きく外れた値のこと

累計とは小計した数を加算した数。
例えば毎日スクワットした回数を数えて、一昨日が10回、昨日が20回、今日が15回でした。
この時1日にやった回数が「小計」
累計は数え始めた日から小計を足し合わせた数なので、累計は45回(10+20+15)になる。

そもそも「統計」って何なのか?

統べて+計る 統べる=多くのものをひとつにまとめること

地域や社会、自然現象などについて知るために、観察や調査、実験をしてデータを集め、そのデータを整理・分析して分かりやすくすることで、問題解決や将来の予測に役立てるのが「統計」

数字を分かりやすくまとめたのが「統計表」
視覚的に表した「統計グラフ」💹📊
統計表をグラフにすると一目で分かりやすい

データを分析すると、解決策が見えてくる

統計に疎いと見抜けないことがある 説得力をつけるには統計学を知っていた方が賢い

統計3大グラフ?!

ヒストグラム 
ある特定のデータを区間ごとに区切り、各区間の個数や数値のばらつきを表現するグラフ(度数分布図・柱状グラフともいう)

散布図 
2つのデータの関係が見えるグラフ

箱ひげ図 
データのばらつきを分かりやすく表現できる便利なグラフ 最大値、最小値、中央値等が見える

最大値、最小値、四角の中の範囲は全体の半分、四角の中の線が中央値

割合を表したい時は「円グラフ」

何を伝えたいのか?
「統計データ」と「知らせたいこと」のふたつがしっかりとしてあること

まとめ

これからの時代はデータを読める、見抜く力も必要になってくる。
時代がコロコロ変わり、基準や常識も変化していく。
追いっぱなしでは、トップになれない。ある程度先を見ながらスキルを伸ばしていきたいと思う今日この頃。
明日も気になる事を備忘録として書いていきます。今日の所は以上です。

コメント

タイトルとURLをコピーしました