Python 独学プログラミング プログラミング初心者のURL取得のエラーコード〜 ‘ascii’ codec can’t encode character編〜

あっ どうも子へびです。

先日アレクサに

子へび

アレクサ!マクロスの曲をかけて!

っとお願いしたらマクロスの全シリーズの曲がほぼ流れて思わずうっとりしてしまいました。笑曲に合わせてそのシーンが蘇るから不思議です。ランカちゃんとシェリル最高♪




一つ目のサイトのデータ集取が終わり浮かれポンチになっていた子へびですが、2つ目のサイトもそんなにうまくデータ集取ができると本人も思ってはいませんが、もしかしら子へびこの作業向いてるのかも〜❤︎なんで思ったりして。でももちろんそんなはずはありません。皆様のご期待に応えて

子へび

あれ〜?指定したURLの取得は間違ってないのにエラーが出て読み込みができないascii’ codec can’t encode characterってなんだろう?

色々エラーコードで調べてみると赤と言う日本語がURLの中に含まれていてその文字を認識できないらしい。

そこへ今回は運良くMaster松陰登場

ラッキ〜
Master松陰曰く

Master松陰

漢字・ひらがな・カタカナは認識できないことの方が多いよ。URLエンコード・デコードってサイトがあるからそこでエンコードしたものをURLに組み込めば良いんだよ。

子へび

なるほど!検索検索。

言われた通りに日本語を入力すると機械語に変換されます。笑 Master松陰の手にかかるとわずか数秒で解決すると言うこの方。

子へび

これはもうMaster松陰という辞書にMaster松陰をしてしまった方がいいのではないか?どなたかMaster松陰をソフト化する気はありませんか?笑プログラミング初心者に売れると思います。

な〜んて思ったりしている間にサイトの取得は成功しました。なのであとはそれをどおするか子へびの問題ですね。

子へび

とほほ・・・。




Python 独学プログラミング プログラミング初心者のスクレイピングと正規表現〜データベース作成編〜

あっ どうも子へびです。

梅雨明けしたかとおもいきや暑い〜毎日とろけまくりの子へびです。『毎日暑すぎてとろけてしまうですの〜』by邪神ちゃん 最近子へびは邪神ちゃんドロップキックの邪神ちゃんのモノマネにハマっております。そしてかなりクオリティ高いと自画自賛しております。笑




データベース作成の為に情報をスクレイピングしてきて正規表現によりデータ取得の手順を勉強中の子へびですがこの正規表現

子へび

なんだこの記号は・・・。どうみても記号の羅列にしか見えない。

初めてPythonのcode見たときもSQLのcodeとswiftのcodeみた時も、慣れるまでしばらくの間はただの記号にしか見えませんでした。でもこの正規表現は特に単なる記号にしか見えません。笑
しばらく自分の中に浸透してくるまでは本当に読めない。どうやったらそんな風に読めるんだ?っと心の底からツッコミを喰らわしている子へびです。

正規表現はあるサイトによると特殊文字を正規表現では、「メタ文字」と呼んでいます。「メタ」というのは、「超」と言う意味。と解説されていて、

子へび

ということはこの表現は『超文字』ってことじゃん!文字って極限に達すると記号になってしまうのか。

と思ってしまった子へびです。でも少ない記号で色々表わせるって便利といえば便利なのかな?まだまだ単なる記号にしか見えずとても意味を読み取れるまでには時間がかかりそうですが、規則はそのまま飲み込むしかないので子へびお得意の丸呑みをしていきたいと思います。

しかし言語(英語やら日本語やらの方)と同じでプログラミングの言語も色んな言語習得すると幅が広がりますね!それにしても

子へび

全てのプログラミング言語がすぐに理解できる翻訳こんにゃく欲しいよ〜どらえも〜ん。

と今は叫びたい子へびです。