麻辣坊主

運動して美味しいものを食べて時々勉強

論文投稿時の Appendix の消し方備忘録

最近多くの国際学会で,投稿時に Appendix なしの PDF ファイルの作成が求められます. 何も気にせず Appendix なし PDF を作るなら MacPreview でカットすれば良いように思いますが,一部の会議では NG なようです. https://media.icml.cc/Conferences/ICML2021/Styles/example_paper.pdf

そこで,上の ICML の Instruction でも推奨されている pdftk を使うことにします. ただし,普通に pdftk を使うと Bookmark 情報が消える(Adobe で開いた時にしおりが無い状態になる)ので, Appendix なし & Bookmark 情報ありの PDF ファイルを作っていきます.

この方法が万全という保証はありませんので,自己責任でお願いします. より良い方法があれば教えてもらえると嬉しいです.

以下の内容は全て macOS 想定です.筆者は Mac mini (M1, 2020), Big Sur ver. 11.3.1 でやりました.

pdftk のインストール & 基本的な使い方

以下の記事で書かれている通り,brew install pdftk はできないようなので,

https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/pdftk_server-2.02-mac_osx-10.11-setup.pkg

から落としてインストールします.

qiita.com

pdftk の基本的な使い方は,以下の記事などにまとまっています:

nwpct1.hatenablog.com

例えば input.pdf の 11 ページ目以降が Appendix の場合は,

pdftk input.pdf cat 1-10 output output.pdf

で Appendix なしの output.pdf が得られます(細かいことを気にしないならこれで投稿して良いと思います).

しかし,これだと前述の Bookmark 情報は消えてしまい,読む人が少し不便に感じる可能性があります.

Bookmark 情報の編集と付与

以下の StackExchange に倣って,Bookmark 情報を編集して付与します.

unix.stackexchange.com

大まかな流れは以下の通りです:

  1. Appendix をカットした pdf ファイルを作成
  2. input.pdf の info ファイルを編集
  3. 1 に 2 の情報を付与

1. まずは,上で紹介した通り Appendix なし PDF ファイル (temp.pdf) を作ります.

pdftk input.pdf cat 1-10 output temp.pdf

2. input.pdf の info ファイルを作ります.

pdftk input.pdf dump_data > input.info

input.info を適当なエディタで開き,

  • NumberOfPages の値を Appendix なしのページ数に書き換え,
  • 下の方の Appendix に対応する部分のBookmarkBeginPageMediaBegin 以下を削除して保存.

こうして作ったファイルを new.info とします.

3. new.info ファイルの情報を temp.pdf に付与します.

pdftk temp.pdf update_info new.info output output.pdf

これで output.pdf は Appendix なし & Bookmark 情報あり の状態になるはずです.