PDFファイルが、ワードやエクセルから作られたなら、テキストが取り出すことが出来るが、印刷物からコピーされた画像から作られたPDFからは、それが出来ない、と思っていた。

ところが、クセロreaderZERO というソフトを使うと、画像PDFにOCRをかけて、「テキスト付きPDF」に変換できる。

ただし、ファイルの大きさが一桁以上大きくなってしまうので、作業途中でそのテキスト付きPDFをネットで転送できない、ということが起こった。

テキストだけなら取り出して「百分の一」以下で転送できる。

やっていて、これでいいのか、確信が持てないが、とりあえず、やってみる。