2011-01-10

Yahoo! Japanの英検過去問題をすべてダウンロードしてテキストファイル化するPerlスクリプト

GitHubのアカウントを作ったので、以前smart.fmにて公開したスクリプトなどをGistに上げておきます。アカウントを作ってから気づいたのですが、GistってAnonymousでもポストできるんですね……。

使用法:

  1. ActivePerlをインストールするなどして、Perlを使える状態にします(その際、Web::Scraperというモジュールも使える状態にする必要があります)。
  2. コマンドプロンプト上で "perl makecsv_yahooeiken.pl P1" などと入力します(準1級の場合)。("P1" の箇所には、取得したい問題の「級」を入力します。英検の7つの級は、それぞれ "1", "P1", "2", "P2", "3", "4", "5" となります。なお、「準」を表す "P" は大文字です)
  3. ダウンロード元サイトの負荷を考慮して、時間を空けてダウンロードしますので、気長にお待ちください。
  4. 実行が終わると "eiken_P1-2007-1.csv" といった名前のファイルができ上がります。

注意点:

  • 以下のような順番で出力されます: "年度", "回", "問題番号", "問題文", "選択肢1", "選択肢2", "選択肢3", "選択肢4", "解答番号"
  • ActivePerl(5.12.2)でしか動作確認していません。今回はWeb::Scraperというモジュールを使っていますが、これだけはActivePerlに標準でインストールされていないので、別途インストールする必要があります。

0 件のコメント:

コメントを投稿