program memo htmlファイルからデータ切り出し

photo1 program memo

 

html ファイルから商品データを切り出す perl script を作っていました。

 

データは、複数入っているので、ループを廻します。 ユニークな文字列が含まれた行だと、パターンマッチで簡単に探し出せるのですが、テキストデータだけの行があって、ユニークな文字列の数行後に必ずあることを利用して、ユニークな行でカウンターをインクリメントします。次の無関係な行ですは、カウンターをインクリメントだけします。次の行は目的の行なので、文字列を抜き出す処理をします。ところが >< データが読み出せません。しばらくの間、カウンターの値を表示させても、ちゃんと増えていって目的の数値まで進みます。?_? ふと気がつくとカウンターの数値を進めた直後に次の行の処理をしていて、ループを廻っていないことに気がつきました。対策は、後からチェックするカウンタをコード上では先に書いておくと、ループを廻ってくれるのでした。順番に必ず処理してくれる perl で良かったなんて^^

 

リンクは、http://step.cx/ からご覧ください。