知らないを知る。メタ認知。by統計

G倹定
WokandapixによるPixabayからの画像

どうも405です。今日も図書館で本を読んでいました。
午前中はG倹定の勉強をしていたのですが、やはり難解な数式やら、理論で武装しているのでなかなか進まない。そこで午後は統計とかインフォグラフィックについての本を読んで、少しでも理論をかみ砕けるようにしようと思いました。

結論からいうと、ディープラーニングの答えでどうしたいか?だと思った。AIを使って何をしたいのか?に至る。

備忘録↓

*十年前のデータ(はっきりいって古いけど)
世界死亡者1年5530万人 1日の151600人 1時間6316人 1分105人 1秒2人

生まれる 1億3140万人 1日360000人 1時間15000 1分250人 1秒4人

ネット恋愛 ドイツ29% スウェーデン28.3% デンマーク、オランダ、フランス26.1% イギリス、ブラジル、スペイン22.6/22.5/21.9% 日本17.4% ヨーロッパは結構多い印象。

人口予測 2050年 インド、アメリカ、インドネシア、ブラジル、パキスタン、ナイジェリア、バングラデシュは増えていく予測 中国は人口調整出来ているイメージ 
2050年に高齢者人口(60歳以上)は20億人に到達するらしい

腐敗、汚職の少ない国 デンマーク、ニュージーランド、シンガポール、フィンランド、スウェーデン、カナダ、オランダ、オーストラリア、スイス、ノルウェー 日本は国は安全だけど腐敗、汚職があるクリーンではない

ちゃんと知らないと子どもも出来ないし農業も出来ないし、

フランスは食事に最も長い時間をかける。肥満が最も少ない国のひとつ。

クリーンエネルギーへの投資が日本は少ないのは何故か?電子力発電に頼っているから

億万長者とは10億ドル=800億円以上の資産を持つ人 アメリカ、中国、ロシアインド、ドイツ… 

統計データって面白いし間違いやすい。いかにデータを読み取るか

・数字の意味を意識する
・真実と意味を明確に分ける
・仮説、検証サイクルに乗せる

の下地をつける。大きな方向を見誤ることが少なくなり、データの先にあるものを見通せるはず。

何故やるか?
これからますますビックデータ時代になると予想していて、データと格闘しなければならない。
だからその下地をつけて、分析(意図が分かる)ようになれば、様々なケースで自分なりの解釈で判断出来ると思う。ちょっとした知恵をつけてちょっと利用したい。

「世の中には3種類のウソがある。ウソ、大ウソ、そして統計だ」イギリスの首相ベンジャミン・ディズレーリ

恣意的 意図・作為が反映される 日本は詭弁なのかも? 詭弁は詭弁。正論を武装しよう。週刊誌ってまさしく弱きをより弱く、強きをより傲慢に見せる過大雑誌だと思う。もちろん、ウソではないがすべてを見せてはいない。人なんか10言っても2ぐらいしか見えない。その2が大きく書いてれば、そうなんだと思ってしまうもんだ。

そもそも何のためのデータなのか? 
・実験科学の領域では、仮説を確かな知識に変えるため 
・モノ作りの現場では、よりよいモノを作り出すため 
・指導的立場にある人にとっては、将来の方針を決めるため 
・利益を生み出したい人にとっては、利益を最大化するため 
・リスクを回避したい人にとっては、異常を察知するため 

重要なポイント 
・データによって、自分の考えを表現すること 
・データによって表現された考えを正しく読み取ること

これができないと解決出来にくいし、ただいたずらにデータに踊らされる。

数字に意味を持たせる。 
人を動かすのは、事実の数字ではなく、意味としての数字のほうだから。 
報告書や資料を提示する場合、「自分なりの意見、見解、解釈」を添えることが原則として求めらている。

「安定している」「横ばい」「低迷している」「変動が大きい」「向上した」「堅調な伸び」「何月以降やや低迷」「++」「・」「−−」「緩い上昇」「緩い低下」「上昇」「〇〇は好調」「〇〇が低迷」

ちょっとしたコメントで意味がある数字へ 
①まず解釈コメントに目を通す
②次に解釈コメントが妥当であるかどうかを、数字の上で確認する
③解釈が合っていると思えば「なるほど」と同意し、違えば、「そうかなぁ?」と反発し、自分の考えをまとめる。

見せ方によっては、情報も変わる。棒グラフ📊は幅を変えると起こりやすい。
グラフに「傾向となるライン」を入れてみると 装飾すると、歪曲イメージを与えられる

「人にどう伝えるか」を考える 真実としての数字と、意味を、込めた数字を明確に分けて伝える

ポイント「私はこのように解釈した」という根拠と道筋を明らかにする

①相手がお客様の場合は、「意見」が求められる。 コンサルティング業務の場合、「改善提案」「結論」→何故の「根拠」の数字を示そう。

②社内レポート、報告書などは、相手の要求に合わせる 結論(意見、改善提案)→根拠(データ)→理由(結論に至った理由)や根拠(データ)→意見(口頭など)

③論文などは手順が多い 要約(手短に結論)→導入→方法→結果(真実のデータ)→考察(自分なりの考え、数字の意味を、持たす)→結論(考察を含めての)

数字に意味を込めると大きな仕事が出来る?! 
人間にしかできない仕事=コンピュータが吐き出す数字が高度化、複雑化すればするほど、それらを平易に解釈し、現場にあてはめる仕事の比重が高まります。 
大学でやりたかったことなのかもしれない。それが、この年でか…

意味重視の傾向 
①立案…どのようなデータ分析を行うかを立案する 
②収集整理…コンピュータに入力するデータを収集、整理する スクレイピングの部分か 
③解釈適用…コンピュータの出力結果の意味を解釈し、現場に適用する

「①立案③解釈適用②収集整理」 
数字に意味を込めることが大事。自分なりの意味と解釈を付け加えるのを意識する。 その数字は良いのか、悪いのか? 上がったのか、下がったのか?他と比較してどうなのか? そのように考えた根拠は何か? 競馬の予想や株の取引みたいだな

まとめ

ちゃんと知らないと子どもも出来ないし農業も出来ないし、AIも使えない。
PythonとAIは手段であって目的ではない。
自分なりの意味と解釈を付け加えるのを意識して、目的や課題をクリアにしていきたい。

はよ、横浜優勝したいぞ。何なの昨日の試合は。野手陣はちゃんと仕事している。

今日はこのへんで以上です。
また明日。

コメント

タイトルとURLをコピーしました