中央値ってなんですか???

申し訳ないです、中央値のいい例えがありません。迷宮入りです(_ _)

今日のPython 初心者ブログ④回目になります。今日のテーマはずばりデータ分析です。とはいってもその前段階のデータの精査、正規化の部分を勉強しました。それを行うことでデータ分析を効率的に行うことが出来るみたいです。

Pandas

Pythonには、色々なライブラリ(プログラムの部品をいっぱい集めたファイル)があるのですが、「pandas」はデータ分析を効率的に行うことが出来るものです。
例えばExcelとかで表データを使うと思うのですが、下の写真みたいなの

例えばこんな感じ

こんな感じのデータを読み込んで使いやすいように入れ替えたり、加工したりをプログラムを使って操作していきます。最終的には機械学習に使うみたいですが、今は分かりません。
今日は単語を覚えてどのような作業が出来るか流れをみる感じでした。
下はメモ用です。

読み込んだデータの確認
CSVファイル=Comma(カンマ),Separated(区切られた)Value(値)を読み込む。

import pandas
pandas.read_csv(“ファイル名.csv”)

データの情報を調べる
print(“データの件数 =”,len(df))
print(“項目名    =”,df.columns.values)
print(“インデックス =”,df.index.values)

列データ、行データ、要素を表示
df [“列名”] 一列
df [[“列名”,”列名”]] 複数列

df.loc [行番号] 一行
df.loc [[行番号,行番号]] 複数行

df.loc [行番号][”列番号”] 一つの要素

列データ、行データの追加削除
df[“追加列名”]=[“行1要素” , ”行2要素” , ”行3要素”]
df.loc[追加行番号]=[“要素1” , ”要素2” , ”要素3″]

df.drop(“列名”,axis=1)
df.drop(行番号,axis=0)

必要な情報を抽出する
df = pd.read_csv(“ファイル名”)
df = df[ df[“列名”] 条件式 ]

df_kokugo = df[df[“国語”] >= 90]
90点以上のデータ

データの集計
print(“数学の最高点”,df[“数学”].max())
print(“数学の最低点”,df[“数学”].min())
print(“数学の平均値”,df[“数学”].mean())
print(“数学の中央値“,df[“数学”].median()) メディアン
print(“数学の合計”,df[“数学”].sum())

並び替え
df.sort_values(“列名”) ・・昇順
df.sort_values(“列名”,ascending=False) ・・降順


df.T ・・行と列を入れ替える
df.values ・・リストに変換する

CSVファイルへの出力
DataFrame.to_csv(“ファイル名.csv”)

インデックスを削除して出力
DataFrame.to_csv(“ファイル名.csv”, index=False)

インデックスとヘッダーを削除して出力
DataFrame.to_csv(“ファイル名.csv”, index=False, header=False)

今日やった部分は以上です。
中央値出てきましたね。
データを大きい順に並べた時の中央の値。中位数ともいう。
データの件数が偶数の場合は、中央の2つの値の平均値を中央値とする。

はい、よう分からんww
ググってみたけど、データの中で、いわゆる「普通」の値を知る際に使います。

中央値=「普通」そういうもんだと思おう。

おまけ

~食=SDGsの根幹である。食=農業が根幹である。~ 
SDGsの基礎概念となった「プラネタリー・バウンダリー」を提唱した科学者は、「食はすべてのSDGs項目に関係しており、食の分野で成果を上げることができれば、人類や地球を救うことになるだろう」と述べています。
D&Tファームの目指す農業革命は、凍結解凍覚醒法を用いる事で、農業を軸とした食のシステムに革命を起こし、改善する事。即ち、活動そのものがSDGsの取り組みであると考えています。

SDGsの話になるのですが、朝ニュースで店内で育てられるInfarm(インファーム)のハーブ・野菜が都内スーパーマーケットで販売開始というのを見たのですが、もう何十年後にはいろんな野菜がいろんな地域で食べられるようになるのかと思いました。めちゃくちゃワクワクしています。

気になる方いましたら、「省エネ型屋内農場システムプットファーム」や「大豆ビーフ」も面白いと思います。

うーんまとまりが無いですけど、今日のところは、このへんで以上です。
また明日。

コメント

タイトルとURLをコピーしました