今何を考えるべきなのか=イシュー

G倹定
Eak K.によるPixabayからの画像

どうも405です。今日もG検定の勉強と本屋と本でした。
統計学を少しずつ勉強していきたい。
これからのビッグデータの時代に必要になるスキルだと思うから。
どんなものがこれからデータになるのだろうか?
スポーツのデータや心拍数のデータ、笑顔のデータ、匂いのデータ、お金のデータなど
これからそれらを読めて資産や示唆できるような、動ける人材になりたい。

備忘録です↓
統計学とAIはとても近い関係だと思う。

均す(平均値)、真ん中(中央値)、多出(最頻値)

なりたい。

1、膨大なデータを操り、ビジネスに活かすためには、
①データを活用したビジネスを企画する力
②データサイエンスを支える統計知識
③アナリティクスを実現するITスキル
が必要。

ビジネス・アナリティクスとは、データに潜む重要なパターンを発見、解釈、伝達し、ツールを使用して組織全体があらゆる環境であらゆるデバイスからあらゆるデータについて質問できるようにするプロセスです。

2、データサイエンスの知識を活かして有効な示唆を得るためにはプロジェクト初期の「発射台・標的の設定」の段階で、チーム全体(経営陣、業務部門)も巻き込みながら意思決定を下すプロセスを怠るべきではない。

3、データサイエンスを習得すれば、スポーツも含めた幅広い領域にその応用対象を見出すことが出来る。

データありきからビジネスありきに。 
多数量解析、探索的データ解析、機械学習などの理論・手法を統計知識とし試行錯誤を繰り返し有効な示唆を得よう

多変量解析とは、複数の変数に関するデータをもとに、これらの変数間の相互関連を分析する統計的技法の総称です。特定の分析方法を指すものではありません。

多変量解析には、重回帰分析やクラスター分析など様々な分析手法が含まれます。中にはエクセルで解析できる手法もあり、高度な数学的知識が必ずしも必要というわけではありません。

  • アンケートの結果から商品の強み・弱みを知りたい
  • 身体測定のデータから病気になる確率を知りたい
  • 既存店舗の売上や顧客数などのデータから、新店舗の将来の売上を予測したい
    目的は「予測」と「要約」

データの多様性、生成速度、データ量の増加という特性を持つビックデータを扱うには、ITアーキテクチャの理解に加えて、高いアプリケーション設計・開発能力が問われる。
適切なシステムにより、テキストデータ、音声データ、画像、ビデオといった非構造化データを扱うとともに、自然言語処理に関する技術力も必要。

ITアーキテクチャ=基本設計や設計思想

偶然では済まされないような、ありえない出来事は、統計学に基づいた「ありえなさの原理」で説明できる

この原理は、「不可避の法則」「超多数の法則」「選択の法則」「確率てこの法則」「近いは同じの法則」5つがある

これらの法則は、日常の小さな偶然から、社会現象、さらに恒星の誕生、生物の進化にまで共通している。統計学的な見方を身につけることで、人々はより誤りなく世界を捉えられるようになる。

根底にランダムさや偶然があることが科学的に分かってきた。
定義するならば「その事象が起こりそうな度合い」

0から1がある

確率には「独立」「従属」がある 
独立的か次に影響するか

探索的データ解析、機械学習などの理論・手法はPythonとG倹定で出てくるな。
あと昨日やっとやっと開幕。 \横浜優勝/
ひとつ勝つのがどれだけ大変なのか。やはり投手陣と野手陣のバランスでゲームを左右する。
横浜を「マネーボール」するをしてみたいぞ。


今日気になった言葉
「己を知りうる者は賢者なり」

今日はこのへんで以上です。
また明日。

コメント

タイトルとURLをコピーしました