スポンサーリンク

HTML::TreeBuilder これだけ覚えりゃ、とりあえずOK(?)

HTML を解析するには HTML::TreeBuilder が便利なんだけど、なかなか初心者向けのドキュメントが見つけられなかったので、自分用の覚え書きの意味も含めて、まとめておこうと思います。

とりあえずこんな HTMLファイル(sample.html) を処理してみましょう。

でもって、パースするプログラムはこんな感じ

何で最後に delete しなきゃいけないかは「 HTML::Element のドキュメントを読んでね」ということなんだけど・・・よくわからいけど delete しておきましょう(ちゃんと読めよ!>自分)。

その他、メソッドとかについても HTML::Element からたくさん継承してきてるので、そちらのドキュメントを読んでおくのは有意義そうです(上手くいかないときに、何かの手掛かりになるかも)。

慣れると JavaScript の getElementBy~ みたいな感じで処理ができて、ホントに便利です。

参照リンク
 ・Geekなぺーじ: HTML::TreeBuilderによるパース(リンクの取得)
 ・hPod: use HTML::TreeBuilder
 ・[ぴ]: HTML::TreeBuilder イイ
 ・perldoc超訳部:HTML::TreeBuilder
 ・CPAN:HTML::Element

スポンサーリンク
コメント
Verify your Comment
Previewing your Comment

This is only a preview. Your comment has not yet been posted.

Working...
Your comment could not be posted. Error type:
Your comment has been posted. Post another comment

The letters and numbers you entered did not match the image. Please try again.

As a final step before posting your comment, enter the letters and numbers you see in the image below. This prevents automated programs from posting comments.

Having trouble reading this image? View an alternate.

Working...

コメントを投稿
トラックバック

このページのトラックバックURL:
https://www.typepad.com/services/trackback/6a01310f1f31c0970c0120a8ba8d03970b

このページへのトラックバック一覧 HTML::TreeBuilder これだけ覚えりゃ、とりあえずOK(?):


プロフィール


  • 書いてる人:夢界 陸

    名古屋在住のおっさん。
    プログラミングやガジェットの話など、 日々の興味を徒然と綴っています。



    Twitterやってます @mukairiku

    運営サイト
    www.mukairiku.net

ブログ内検索

Licenses

  • Creative Commons License

OTHER

  • このブログのはてなブックマーク数

Blog powered by TypePad

スポンサーリンク