午前中は、朝8時ぐらいから3時間ぐらい進めていました。
今日からは「 Python2年生 スクレイピングのしくみ 」というものを使って勉強していました。
参考にしているもの
- Python2年生 スクレイピングのしくみ
- つなげば動く!Python ふりがなプログラミング パターン文例80
スクレイピングとは何ぞや??
と思いの方、安心してください。説明します。
Webサイトから情報を収集する事を → クローリング
収集したデータを解析して必要なデータを取得する事を → スクレイピング
と言うことを知りました。これでビックデータを扱うのか💂
それとスクレイピングを行う際は次のことに注意する
①著作権を守る
②アクセスしすぎて業務を妨害しない
③クローリング禁止のサイトは対象にしない
* クローリング禁止かどうかは 「robots.txt」または
ページの「robots meta タグ」に記載されている
htmlのことや タグ 要素
WordPressでもあるように、タグ ヘッダ部 ボディ部 metaタグ H1 H2 属性 要素やら色々分からないことを調べていました。何処の情報を収集してくればいいのか、タグと、にらめっこしながら進めていました。比較的プログラムの部分はまだ序盤だからか分かりやすかったです。
やってみたい事(野望)
やはり分析してグラフで分かりやすく表示させれるぐらいにはなりたいです。
競馬の予想アプリみたいなもん作るぐらい言えればいいのですが、、、あっ、でもそれも面白そうですね。
興味あること (#漫画1)
漫画の話なんですけど、勉強していてやはりモチベーションが上がらないときに読みたい本があったので読んだのですが、やはり面白い。
知っていますか!? 「め組の大吾」
曽田正人先生の作品は結構好きで読んでいるのですが、主人公の大吾がまた馬鹿みたいに熱い男で自分は一番好きです。なんと最近知ったのですが月刊マガジンで新しく連載が始まっているそうです。その名も「め組の大吾 救国のオレンジ」と言うそうです。これは要チェックですね。
SDGs(エスディージーズ)
少し前あたりから聞くようなってきた単語ですが、
「17の大きな目標があって2030年までにやっていこうよ」 というもの。
その中身は貧困や飢餓、健康や教育、環境問題、エネルギーと数多くの問題を国連加盟193か国が2030年までに達成するために掲げたものを略称でSDGs(エスディージーズ)と言うらしいです。
朝のニュースで大豆でつくられたミンチを紹介していたのですが、世の中の食料事情を知らなさすぎるじぶんがいました。それを見て今後はSDGsについてブログに書いていこうかなと思いました。
今日のところは、このへんで以上です。
また明日。
コメント