発売日 2014年08月23日(土)

Rubyによるクローラー開発技法

著者名:るびきち、佐々木拓郎(著者)

¥2,980(税別)

ISBN:
978-4-7973-8035-4
サイズ:
A5/1色
ページ数:
448
付録・付属:
-

購入する

全国の書店、または以下のネット書店よりご購入ください。

※書店によって在庫の無い場合、お取扱いの無い場合があります。予めご了承ください。
※各ネット書店での詳しいご購入方法は、各サイトにてご確認ください。

紙版を購入

電子版を購入

著者紹介

著者・るびきち、佐々木拓郎

サポート情報

この商品に関してのお問い合わせは、右上の「お問い合わせ」ボタンからお願いいたします。
※ご意見、ご感想は、このフォームよりお寄せください

Twitter

Unable to load Tweets

  • サンプルプログラムに注意

    4.0
    fettle

    ◼️文字コード2014年8月22日「Rubyによるクローラー開発技法」サンプルスクリプト[…]のzipファイルのサンプルはそのままでは動作しない。UTF-8への変換が必要(以下は上書きなので注意)です。find RubyCrawlerSample/ -type f | xargs -n 10 nkf -w --overwriteこのサンプルは、著者というより出版社が用意したような感じなので、出版社側の問題なような気がしますが、修正をお願いします。>SBクリエイティブ様MACではfindはあってもnkfは標準ではないので、brew install nkfなどでインストール。・MACでの注意点MAC環境では、¥ではなく、バックスペース\(オプションキーを押しながら¥で入力)入力が必要であることに注意。私のように¥とバックスペースが同じと思っている人はハマるかも。。・その他感想rubyの勉強がてら動かしていますが、%rによる正規表現(/xxx/の代わりに%r!xxx!とかく)、map |(aurl,atitle),ymd|の理解、*ymdでの*による配列展開、[x, y, z, ...]によるリスト生成。など、少し手間取るところがありました。1章(10分クローラーの作成)までは、くどいくらいの説明で良いかもしれません。まあ、何か言語をやったことのある人は、WEBで調べながらやるので問題ないかもしれませんが。

  • サンプルコードで動かないものがある

    3.0
    Amazon Customer

    wgetコマンドの使い方から始まり、本格的なクローラーの作成方法が学べる良書だと思います。Rubyについて熟知している必要はありませんが、多少の予備知識は必要な気がします。少し残念なのは、サンプルコードで動かないものがいくつかありました。原因は単純なものですが、サンプルコードがちゃんと動作確認されているのか不安になります。・文字コードがUTR-16になっており、実行時エラーとなる===============================$ ruby sbcr1-parse.rbsbcr1-parse.rb:1: invalid multibyte char (UTF-8)===============================・空白文字が入っており、実行時エラーとなる===============================$ ruby rss-reader.rbAmazon.co.jp: Kindleストア > Kindle本 > コンピュータ・ITのベストセラーrss-reader.rb:11:in `block in

    ': undefined local variable or method `      ' for main:Object (NameError)===============================また、サンプルコードを動作させるRubyのバージョン情報が2章に記載されており、分かりづらかったです。前書きや1章などもっとはじめの方に記載して頂きたいです。バージョン2.0.0で動作確認されているということですが、最新バージョン2.3.0でも問題なく動きました。

  • 根気が必要

    4.0
    れっとらか

    rubyをまったく知らない状態から、この本と「たのしいruby」を読んで、クローラーが自作できるようになりました。読んでいて一番困ったことは、本書に紹介されているツール類のインストールです。windowsとubuntuで同時並行で作業を進めました。紹介されているツールをインストールしながら、サンプルスクリプトを実行して動作を確認するのですが、一方のosで動くツールがもう一方では動かないことが多かったです。原因はツールの細かいバージョンの違いによるバグの有無でした。最初に紹介されているwgetで、すでに本書の説明どおり動かないバージョンがあり、あとはそんなもののオンパレードでした。おもなところではsqlite3とかfirefoxとかです。firefoxは3つのバージョンを試しましたが、seleniumで動作するのは、ひとつだけでした。また、Amazonのようにヘッダにutf8と書かれているのに実際はshitf-jisでエンコードされているサイトが取り上げられているのも疑問でした。本書の前半ではさもanemoneで取り扱えるように書いておきながら、後半ではあきらめて、文字化けした実行例を掲載していることにあぜんとしました。私のような者がクローラーを作れるようになったのは、ひとえに本書のおかげです。感謝します。でもこの本を読み進めていくことは時間と根気が必要です。

すべての31つのレビューを表示

  • baboocon

    RubyでWeb上の情報を効率よく収集するクローラーと呼ばれるプログラムを作成、運用するための実践的手引き。豊富な実用例が示されていて、ほぼそのまま試してみることもできる。特にanemoneというクローラーフレームワークとHTML構文解析ライブラリのNokogiriはよく使われている。一からクローラーを作るよりも、APIが提供されている大手Webサービスはそれを利用すべきだとか、対象サイトに負荷をかけない慎重な運用を心がけるなど実際に運用する上での注意点も勉強になる。 続きを読む

  • しんしん

    クローラーを作成してWeb上から情報を収集する方法が具体的に記されている。 実行するときにはサイト規約や法律上の問題・収集対象サイトのパフォーマンスに配慮したやり方をやらなければいけない。 必要な時には作ることができるという自信を持った。 続きを読む

  • のぶ

    本書で最も多用しているツール「アネモネ」の開発が止まっている状態(と本書でも言及してるが)なのが本書の長持ち度に暗雲となるのではと一瞬は思ったけど、考えてみたら本書の後半で実例を沢山示している現実のネット上でのサービスの側はツール界よりもさらに変化の激しい世界だから、ネット関連の技術を紙で出版しようとした時点でもう織り込み済のリスクの範囲内なのでしょうね。プログラミング本としてはニッチなテーマ設定ではあるけど、総論から実例集さらには関連技術の検討に至るまでしっかり書いてある、予想以上によくできた本でした。 続きを読む

すべてのレビューを読む