今回あるサーバーを入れ替える事になった。古いサーバーではSQL SERVER 2000が動作しており、新サーバーではSQL SERVER 2005を使用する予定だ。サーバー入れ替え時にはプログラムが正常に動作するのか検証が必要だ。データベースのテーブルの照合だったらSQL文をで比較してしまえば簡単なのだが、問題は紙に出力する帳票類だ。今回、テストするページ数はA4とA5を合わせて6,000ページ以上!!これを一文字も見逃さずに新旧で照合するのは並大抵の努力ではないし、また、それに要する時間も半端じゃないと思う。2人でやったら1カ月くらいかかるんじゃないの?その後、誤りが判明したらまた照合。これを何回かやったらいい加減イヤになってくると思う。
これを何とかプログラムでできないかと思い、インターネットでPDFを照合するソフトが在るかなと思って検索してみると、Brava DesktopとDiffPDFの2つが見つかった。
早速使い比べてみた。
Brava Desktopは有償のソフト、対するDiffPDFはフリーソフト。どちらが良いかな。
完全に一致しているPDF同士を比較するならば、DiffPDFの圧勝!! DiffPDFは差分があったページだけを抽出して表示してくれるから、完全に一致している場合は結果画面に「2つの文書は一致していると思われる」と少々自信なさげなメッセージを表示してくれる。1,000ページ位あっても所要時間は2分程度。それに対してBrava Desktopは不一致のページだけを抽出表示する機能がないので、1ページずつ黙視で確認していくしかない。これはかなり手間もかかるし、ミスも誘発すると思う。
しかし、帳票にはタイムスタンプがついている事が多い。その場合はどちらのソフトを使用しても全部のページがエラーページとなってしまうので、今度はどこがエラーしているかを正確に把握できる事が重要だ。その場合は、帳票の種類によってBrava DesktopとDiffPDFの両方に軍配が上がる。
照合するPDFによって2つのソフトを使い分けるとより早く照合作業を完了させられる。今回、6,000ページ以上を照合したが、要した時間は1人で8時間程度だった。やはりタイムスタンプの部分やSQL SERVERの返してくる値の順番によって値の印字位置が違う場合に時間を費やしてしまったので、使いながらどちらがより使いやすいかを考えた方が良いと思う。
それにしても、DiffPDFには大いに感謝!!