いまさら聞けないあれこれ 「PDFだけあります」

「探しましたんですが、PDFしか残っていません」
こじれたりねじれたりして今さら聞けない頼めない大人の事情か、
会社もソフトも生き残れない、そんな時代の流れがそうさせたのか。

PDFは完全データ、弄れないし触れない、コピペは文字化けのオンパレード…
でも修正したいし流用もしたい…そんな状況に陥ったら。

今回は、PDFしか手元に無い状態で、どこまで、何ができるのかを解説します。

■PDF、いじれなくはないけれど

Adobe Acrobatを代表として、有料無料、機能や種類様々なPDFの修正ツールが世の中に出回っています。
また、PDFも開けるソフトを使ってムリヤリですが修正することも出来ます。
PDFしか無い、どうにも出来ない…といって嘆くには早すぎますよ!

#ただ、見切りが早すぎてすぐにPDFで修正すると、それはそれで面倒なことに

▼王道はみんな納得するから王道なのだ

まず最初に考えるのは「Acrobatとか、PDF修正ソフトを使えばいいんじゃね?」だと思います。そして挫折するところまでが定型、テンプレートです。
やってみると分かりますが、業務用(ン百万クラス)のPDF修正ソフトでないと作業が面倒すぎます。Acrobatのテキスト修正ツールは、1行単位での修正作業、そして作業で使える機能が少ないので複雑な作りだと目的のパーツを触ることすらできません。検索出来ても、置換は出来ないのは歯がゆすぎます。Wordの太字指定部分は、元のテキストにフチ線付けた別パーツが重ねて配置されてたりして微妙に触れなかったりとか。 ムギャオー!

こういったソフトは、トリミングやデータ容量の圧縮、色やページの変更、付せんなど付加情報の管理を目的としており、細かい部分の大幅な修正は想定していません。作り替えるなら元のレイアウト、Officeで、ということですね。

数カ所程度の訂正、同字数での単語差し替えであれば、こういったソフトで直すのも手かもしれません。もちろん作業前、作業後のプリントアウトを見比べて、変わってないことは確認しましょう。それと、訂正履歴はどこかに残したほうが良いと思いますよ!

▼泥臭く切った貼ったしてやろうじゃないの

PDFを直接修正できるといって、原本(になるかもしれない)データを弄るのはちょっと怖くありませんか。もしかしたら、元のレイアウトデータがどこからか出てくるかもしれませんし。

そういうとき、トルママや同字数の差し替えのようなきわめて部分的な修正なら、PDFをいじらないのも手です。直したい箇所を別のソフトで作ってシールのように上から重ねて貼っちゃいましょう。スマートではありませんが、PDFを修正しようとして、思ってもない部分が変わったりするかもしれませんしね。

やり方としては、レイアウトソフト上でPDFを配置し、その上から訂正シールのように直し部分を作って重ねて貼り付けるのがカンタンです。増刷での奥付修正や、電話番号の差し替えなら問題無いんじゃないでしょうか。フォントや級数、文字組を合わせる必要もありますが、頑張ってください! 1カ所だけ、1行だけ合わせられないのが気になるなら、段落や関連する部分を丸ごと作り替えれば違和感は減ると思います多分。
ただ、何らかの理由で「また」PDFだけ残ったりすると、PDF自体に修正、訂正が反映されてないわけですから、手間というか、事故というか、つまりは面倒が発生!します。

修正したレイアウトデータからPDFを書き出せば更新されたPDFデータが出来るのでそれを残す、そういう運用もそれはそれで有りです。
訂正箇所ごとにフォントや級数、文字組、画像の調整なんかバラバラになる可能性もありますが、修正ルールを徹底しとけば問題無いと思います。修正に修正を重ねると、「ココ、なんか行間ずれてない?」「このページだけ写真の色が違う感じ…」って違和感は生まれるかもしれませんが。

▼ムリヤリなんてそんな…!

PDFは異なる環境でも同じレイアウトが表示可能なフォーマットで、テキスト文書や図版、画像、入力フォームや動画、果てはウェブサイトも内包できます。最近ではISO規格化してますし、多くのソフトでPDF保存が可能です。保存が可能なら、開くことも、まー大抵は可能ってことですね。

で、AcrobatやPDF修正をうたうソフトはPDFの規格、ルールに沿って修正し、あくまでPDFとして扱います。トリミングや文字修正して保存してもPDFはPDFのまま。
では、Illustratorなどのドローソフトや、Photoshopに代表される画像修正ソフトでも、PDFデータを開いたらどうなるのか。開いた瞬間、PDFからIllustratorやPhotoshopのデータにムリヤリ変換されますので、フォントが無いとか、文字組情報が抜けて長文も1文字単位でバラバラだとか、文字と画像が合成されてテキスト情報が拾えないとか、1枚画像じゃんコレ!とか、大抵はアレな惨状に。状況は、たぶんPDF1ファイルごとに違いますな。

このように、ムリヤリこじ開けることで通常のDTP作業に落とし込むことは出来ます。前述の様に、元データと修正データが違うソフトだと運用上煩雑ですし、部分的に使いたい、再現性はそれほど問わないなんて状況なら、問題無いと思います。
ただ、うっかり上書き保存すると、面倒なことになるかもしれませんねー

#IllustratorならPDF保存時に「Illustratorの編集機能を保持」ってオプションがありますが、それが出来ない場合の話をしてますのでそれは見ないふりします。

▼つきあったら最後まで

PDFだけしか無いならソレを弄る一択ですが、レイアウトデータも残っているならそちら「を」修正したほうが無難です。もしくは、レイアウトデータ「も」修正しておきましょう。原本が2種類あっちゃ「なんで直ってないの!?」事故の元ですよねー。
また、元データと修正データが別アプリ、別形式なわけで、例えばテキストだけ抜きたいとかその部分だけ切り出したいとか、ついついうっかり色々忘れて元のPDFだけ渡したり使ったりとか、やらかす可能性もわりと有るような。

ですので、こういったシール訂正的修正をするなら、それなりに覚悟が必要ってことで。PDFじゃなく高解像度スキャンデータって気分に切り替えて、元は弄らないよねスキャンなんだし!と割り切れば、出来る出来ないの区別は付けやすいかもしれません。

このように、いろいろイヤな想定を並べてみましたが、悪いことばかりではありません。
レイアウトデータを持っていても、制作時と同バージョンのソフトやOS、またそれを使える人のコストはそれなり必要ですし、PDFだけ持ってる方が割り切れると思います商売的な意味で。デジタル環境の移り変わりって犬どころかネズミ並の速さですしね!

■ただ、それがやりたいだけなのに!

▼フォントが何も…無い?

「テキスト選択ツール」を使っても、テキストが選べない…なぜ?

こういう時は、Adobe ReaderやFoxit ReaderなどPDF閲覧ソフトでファイルの「プロパティ」を見てください。「概要」や「セキュリティ」に「フォント」のタブがあるはずです。そのデータで使われているフォントの種類を表示するタブですが、そこが真っ白ならテキストデータは残ってません。文字はアウトラインされ、図版、単なる線画になってるってことですね。ざんねん!
ここでなんとかしたいなら、Acrobatの「テキスト認識」や、画像や図版から文字認識するOCRソフトを使うしかありません。

Acrobatの「テキスト認識」は文字認識と認識したテキストをPDFへ重ねる機能です。
使ってみると一目瞭然、「テキスト修正ツール」で選択できます。やったね!
OCRソフトはPDFを読ませてテキストやWord形式に書き出します。文書スキャナに付属してるソフトです。

ソフトによって認識の得手不得手はあり、日本向けのソフトは英文が苦手とか、記号は微妙とか、表は得意とかいろいろです。書籍なら誤字率5%以下ぐらいですし、Wordなどワープロソフトに付属の校正機能も活用したいところです。

一から打ち直す苦行は避けられます…が、校正の手間を誰が負担するのか、って問題はついて回りますな。

▼バラバラのパーツ…画像一枚欲しいだけなの…に…

画像を使いたいけど、直に開くと画像がバラバラ! 誰だこんなことしたの!

エディトリアルより、グラフィカルなデザインの雑誌や表紙のPDFを開くと、画像と文字が一体化、画像はバラバラのパーツになっていることがあります。入稿用完全データ、製版用出力で使われるPDFで見られる現象です。
理由としては、製版で使われるPDFのバージョンが相当下のほうに設定されているため、透明効果等々の機能は画像へ合成&バラバラのパーツ化して再現、って感じです。正確に出力するためだけにPDF化したので、開くことは全く考えてないっつーかですね。

これはもうしょうがないッス。Acrobatの「名前を付けて保存→画像→(各種画像保存形式)」で書き出して、画像修正ソフトでトリミングやコピー&ペーストしちゃいましょう。

PDFから別形式、特に画像として書き出すことで、PDF自体の不安定さ、不確定さを無くすことは出来ます。取り回しはかなり悪くなりますが、Acrobatのバージョンがどうこうとか、あのPDFビューアでは再生できないとか、そういった問題からは解放されます。

▼コピー&ペーストできない…だと…

「テキスト選択ツール」でテキストを選んでメモ帳にコピペしたら文字化けが! 英数字はOKだけど日本語は□、豆腐ばっかりだ!

PDFでも、製版用PDFなどでちょこちょこ発生します。PDFデータ内でフォントや処理を完結するべくエッジの効いた処理をした結果、要らないものは全部切り捨てた! いまさらPDFを開くなんて想定しちゃいませんよ、ってことです。

この場合、出来そうで出来ないのが腹立つところです。しかもテキスト扱いのままなのでAcrobatの「テキスト認識」は適用できません。
しょうがないので、いったん画像に書き出しPDF再保存した上で「テキスト認識」、もしくはOCRソフトを使いましょう。

修正ならAcrobat(や他のPDF修正ソフト)のテキスト修正ツールで直すことは可能です。しかも、入力したテキストはコピペ可能。見た目が問題なさそうなだけに、むしろ心が折れるかもしれないのがこのパターンです。

#「素のテキスト(に対応する文字コード番号。例えばS-JIS「あ」なら82A0)+フォント指定+OSで読み込んだフォント」ではなく「データ内でのみ使える1文字ごとの通し番号(例えば0C9F)+フォントデータから切り取った文字ごとのデザイン」へ作り替えられており、PDFのテキストをコピペしても対応する文字にならない…という話で、フォントの埋め込みの都合や、PDFのルールとしてはあっても無視してもかまわないとか、そういう大人の事情です。

■三共グラフィックの取り組み

「PDFしか残ってないんですが、なんとかしてもらえませんか?!」という問い合わせにも、前向きに取り組んでおります。まずはデータ確認とお見積もりとなりますが、お気軽にお問い合わせください。

カテゴリー: 今さら聞けない用語, 用語解説