Python 独学プログラミング プログラミング初心者の困った時のお役立ちサイト〜解説がわかりやすい編〜

あっ どうも子へびです。

なんだか突然寒くなっちゃってお菓子ばかり食べている子へびです。寒いとお菓子は関係ないとツッコミを入れられそうですが関係あると思います。笑 冬眠準備ですかね?
そして全く関係ないですが早く劇場版鬼滅の刃がみたい子へびです。




さて解決策が見つからずいつまでも同じコードばっかり見て飽き飽きすることありませんか?子へびは基本的に飽きっぽいので同じところに停滞しているのはとっても苦手です。解決策が見つからず行き詰まっていると本当気分落ち込みます。

子へび

あっ この文章書いてるだけで子へびがもがいてるのがもうおわかりですね?

解決策は色々検索してみてサイト読んで出口を見つけるわけですが、最近幾度となくお世話になっているお気に入りのサイトを今日はご紹介。

Pythonのチュートリアルです。
Python おすすめサイト

ネット上では色々な方が記事書いてくれてコードの使い方の説明とかしてくれてますが、最近子へびはこのサイトの説明と例題が一番しっくりきます。

子へびみたいな初心者に必要なのは

子へび

みやすい。くどくない。わかりやすい。文章が長くない。あきない。←これ結構重要

一体何様だよってぐらい条件が必要です。笑

でも理解できないと使えないですからね。最近色々なサイト読み比べてみてふとそう思いました。もしよかったら参考にどうぞ〜。

ところで子へびはこのサイトを参考に出口が見つけられたのでしょうか?

子へび

・・・。 何か?

とういういつものどハマり具合ということですね。笑




Python 独学プログラミング プログラミング初心者のencodeとdecodeでエラー発生〜UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x80 in position 0: invalid start byte編〜

あっ どうも子へびです。

先日かぼちゃプリンを初めて作って美味しくできたのでご満悦な子へびです。手作りのプリンの良さはなんと言っても自分好みのカラメルソースが作れるところでしょうか?
カラメルソースたっぷり派ですか?苦味派ですか?このあたりみんなそれぞれ好みがありますよね。笑

お菓子も作りつつスクレイピグに取り組んでいる子へびですが、あらゆるエラーコードを呼び出しています。決して好き好んでエラーを発生させているわけではありません。
今回はその一つのエラーコード子へびのような初心者にはまんまと引っかかりそうなネタをご紹介




子へび

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x80 in position 0:invalid start byte このエラーコードはなんだ?decodeできないって言ってるよね〜。

色々サイトを検索してこのエラーコードが出た時の解決策を探ったのですが

子へび

HTMLの中身が文字化けしちゃうな〜。

っとどうしても読み取りができない始末。

こんな時は頼みの綱のMaster松陰に相談。するとMaster松陰の回答は

Master松陰

これは元のデータが S-JIS でかかれてるんだよ。だから、pythonで読むときに S-JISで読み込まないとダメね。多分、今は UTF-8で読むようになってるんじゃない?

子へび

やっぱり〜。そこまでは読み取れました。でも読み込みをJISにするのが気付いていなかった!

Master松陰

古いサイトとか、素人さんが作ったサイトだと
S-JISとかになってるんだよ。イマドキは UTF-8を使うのが常識だけどね。

ということでもしこのエラーコードが出て行き詰まってしまう方がいたらコードの書き方は間違っていないのにサイトに書かれてる文字が何で書かれているのかを確認してdecode設定すると解決するかもしれません!

子へびこの文字についてはかなり検索しました〜。今度どのくらい検索したか数えておこうと思ったぐらいです。笑
でも実際はこんな簡単な解決方法だったりするのでもしご参考になれば。

そして子へびまた新たなるエラーコードが発生しております。

子へび

次なんだ!とほほ・・・。




Python 独学プログラミング プログラミング初心者の正規表現〜PyCharmを使って編〜

あっ どうも子へびです。

最近本の分野ではどっぷり芥川龍之介にハマっている子へびです。芥川龍之介って読めば読むほど子へびの中では『芥川君』と呼びたくなるのは子へびだけですかね?”さん”とか”呼び捨て”とかじゃなく”君”なのです。今まで他の作家で○○君と呼びたくなった人居なかったんですよね〜。なんでだろう?それはおいといて笑 芥川君の本残されたている作品が少なくて本当に残念です。もっとたくさんの作品読んでみたかったな。芥川君の作品子へび大好きです!




そんな芥川君ワールドにどっぷりとハマりつつ正規表現を勉強中の子へびですが、最近正規表現がようやく記号から文字に見えつつあります。笑
Master松陰からいただいたありがたいサンプルコードをお手本にちくちくいじっていた子へびですがまたいつもの情けさない落とし穴に毎度のことながら落ちました・・・。

子へび

おかしいな〜。どおして2つ目のカテゴリーまで抽出できるのに3つ目4つ目が全く読み取れないのかな?正規表現が違うのかな〜??

っと散々正規表現を検索しては書き直してを繰り返して費やすこと1週間。

子へび

は!そもそも2つ目のカテゴリー行までしか読み込み範囲指定
できてないじゃん!

コード全体を読み直してみたらそもそも全てのカテゴリー行を読み込む範囲指定を書き間違えていて全体のうち半分しか読み込めてないから3つ目4つ目のカテゴリーは範囲指定外だったんです。そりゃエラーになりますよね。本当情けない。




そして3つ目4つ目のカテゴリーが抽出できたかと思いきや、

子へび

おかしいな〜?どおして3つ単語が入ってるはずなのに1つしか抽出されないのかな〜?空白と改行が入ってると正規表現の書き方がちがうのかな〜?

っとまたつまづいて空白やら改行を取り除く正規表現を検索して書き直してを繰り返すこと1週間

子へび

は!ちゃんと3つの単語抽出できてるのに子へびのMacの画面が小さくてPyCharmの画面が途中で切れてる!

画面を横スクロールしたら残りの2つの単語が出てきました・・・。本当に本当に情けない。

こんな情けないことを繰り返しながらなんとか欲しい情報をゲットしつつある子へびです。

こんなことにつまづいてる間に

Master松陰

新しいアプリのネタが思いついて7割できた〜♪

子へび

そのスピード感子へびにもください。

と心から願った子へびです。

子へび

とほほ・・・。




Python 独学プログラミング プログラミング初心者のスクレイピングと正規表現〜データベース作成編〜

あっ どうも子へびです。

梅雨明けしたかとおもいきや暑い〜毎日とろけまくりの子へびです。『毎日暑すぎてとろけてしまうですの〜』by邪神ちゃん 最近子へびは邪神ちゃんドロップキックの邪神ちゃんのモノマネにハマっております。そしてかなりクオリティ高いと自画自賛しております。笑




データベース作成の為に情報をスクレイピングしてきて正規表現によりデータ取得の手順を勉強中の子へびですがこの正規表現

子へび

なんだこの記号は・・・。どうみても記号の羅列にしか見えない。

初めてPythonのcode見たときもSQLのcodeとswiftのcodeみた時も、慣れるまでしばらくの間はただの記号にしか見えませんでした。でもこの正規表現は特に単なる記号にしか見えません。笑
しばらく自分の中に浸透してくるまでは本当に読めない。どうやったらそんな風に読めるんだ?っと心の底からツッコミを喰らわしている子へびです。

正規表現はあるサイトによると特殊文字を正規表現では、「メタ文字」と呼んでいます。「メタ」というのは、「超」と言う意味。と解説されていて、

子へび

ということはこの表現は『超文字』ってことじゃん!文字って極限に達すると記号になってしまうのか。

と思ってしまった子へびです。でも少ない記号で色々表わせるって便利といえば便利なのかな?まだまだ単なる記号にしか見えずとても意味を読み取れるまでには時間がかかりそうですが、規則はそのまま飲み込むしかないので子へびお得意の丸呑みをしていきたいと思います。

しかし言語(英語やら日本語やらの方)と同じでプログラミングの言語も色んな言語習得すると幅が広がりますね!それにしても

子へび

全てのプログラミング言語がすぐに理解できる翻訳こんにゃく欲しいよ〜どらえも〜ん。

と今は叫びたい子へびです。