論文投稿時の Appendix の消し方備忘録
最近多くの国際学会で,投稿時に Appendix なしの PDF ファイルの作成が求められます. 何も気にせず Appendix なし PDF を作るなら Mac の Preview でカットすれば良いように思いますが,一部の会議では NG なようです. https://media.icml.cc/Conferences/ICML2021/Styles/example_paper.pdf
そこで,上の ICML の Instruction でも推奨されている pdftk を使うことにします. ただし,普通に pdftk を使うと Bookmark 情報が消える(Adobe で開いた時にしおりが無い状態になる)ので, Appendix なし & Bookmark 情報ありの PDF ファイルを作っていきます.
この方法が万全という保証はありませんので,自己責任でお願いします. より良い方法があれば教えてもらえると嬉しいです.
以下の内容は全て macOS 想定です.筆者は Mac mini (M1, 2020), Big Sur ver. 11.3.1 でやりました.
pdftk のインストール & 基本的な使い方
以下の記事で書かれている通り,brew install pdftk
はできないようなので,
https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/pdftk_server-2.02-mac_osx-10.11-setup.pkg
から落としてインストールします.
pdftk の基本的な使い方は,以下の記事などにまとまっています:
例えば input.pdf の 11 ページ目以降が Appendix の場合は,
pdftk input.pdf cat 1-10 output output.pdf
で Appendix なしの output.pdf が得られます(細かいことを気にしないならこれで投稿して良いと思います).
しかし,これだと前述の Bookmark 情報は消えてしまい,読む人が少し不便に感じる可能性があります.
Bookmark 情報の編集と付与
以下の StackExchange に倣って,Bookmark 情報を編集して付与します.
大まかな流れは以下の通りです:
- Appendix をカットした pdf ファイルを作成
- input.pdf の info ファイルを編集
- 1 に 2 の情報を付与
1. まずは,上で紹介した通り Appendix なし PDF ファイル (temp.pdf) を作ります.
pdftk input.pdf cat 1-10 output temp.pdf
2. input.pdf の info ファイルを作ります.
pdftk input.pdf dump_data > input.info
input.info を適当なエディタで開き,
NumberOfPages
の値を Appendix なしのページ数に書き換え,- 下の方の Appendix に対応する部分の
BookmarkBegin
やPageMediaBegin
以下を削除して保存.
こうして作ったファイルを new.info とします.
3. new.info ファイルの情報を temp.pdf に付与します.
pdftk temp.pdf update_info new.info output output.pdf
これで output.pdf は Appendix なし & Bookmark 情報あり の状態になるはずです.