Golang – 簡単なWebクローラー – 諦めなければできる

今回は、Goを使って簡単なクローラーを作成してみたいと思います。

今回はDB登録までは作成しない予定ですが、機会があればDB登録は次回にしていきたいと思います。

前ソースコードはいかに格納されています。

クローラーとは、検索エンジンがサイトの内容を把握するためにインターネット上を巡回しているロボットのことを指します。クローラーが巡回したサイトがGoogleの検索結果に表示されるようになるため、SEO対策上極めて重要なものになります。

GOPATH（作業ディレクトリ）変更についてわからない方はこちらを参考してください。

１３行目：今回はGoogleの情報を取得するため、GoogleのURLをセットします。
１４行目：httpパッケージを利用してGETリクエストを送ります。
２１行目：getHtml ()が終わる時点でres.Bodyをクローズします。
２３行目：Bodyからバイトスライスを取得します。
- ioutil.ReadAll関数は、引数の io.Reader から内容を全て読み込んでバイトスライスとして返します。

４０行目：文字列からHTMLドキュメントを読み込みます。この時、Parseのパラメータ型がio.Readerなので、strings.NewReaderを利用して変換してから渡します。
４２行目：４０行で変換したデータから全てのエレメントを取得します。

保存まで終わったらhtmlqueryをインストールします。

インストール方法はgo getコマンドでインストールできます。

今回はGoを使って簡単なクローラーを作成してみました。文法とかわからなかったのもありましたけど、勉強しながら作成しました。

次回はDB登録をしていきたいと思っています。