- 学習用ページの取得
textcrawler.py -o nikkei http://www.nikkei.co.jp/
- 学習
analyze.py nikkei.2009xxxxxxxx.zip > nikkei.pat
- 抽出用ページの取得
textcrawler.py -o nikkei http://www.nikkei.co.jp/
- 抽出
extract.py -Ceuc-jp nikkei.pat nikkei.2009yyyyyyyy.zip > nikkei.txt
No comments:
Post a Comment