Adobe Acrobat不要!無料でPDFを編集、変換、署名、OCRまでできてしまう新時代のソフトが最強すぎた【Stirling PDF】

データ

スポンサーリンク

私、GitHubで探検するのが若干の趣味になっておりまして、たまたまPDF操作ツールとしてAdobe Acrobatを超える逸品を見つけてしまったので共有します。

日本語対応もしている無料ソフトなので、PDF関連での出費やセキュリティにお悩みの方は必見です。

概要

ソフト、とタイトルにありますが、実際にはアプリケーションといった方がイメージに近いです。

Dockerというエンジニア御用達アイテムを使うので、システムに慣れない方は若干苦労するかもしれませんが、なるべく分かりやすく解説していきます。

Stirling PDF

アプリ名は「Stirling PDF」。公式説明は以下の通りです(Google翻訳使用)。

Stirling-PDFは、Dockerを使用した、ローカルでホストされている堅牢なWebベースのPDF操作ツールです。PDFファイルに対して、分割、マージ、変換、再編成、画像の追加、回転、圧縮など、さまざまな操作を実行できます。このローカルでホストされているWebアプリケーションは、すべてのPDF要件に対応する包括的な機能セットを含むように進化しました。

とりあえず、PDFの分割・結合・変換・編集・画像追加・回転・圧縮などの機能があるようです。

ブラウザから操作し、インターフェースは以下のようになっています。シンプルで使いやすそうですね。

ちなみに上の英語の画像は公式のもので、日本語にもちゃんと対応しています。(画質が悪くてすみません)

特徴

特徴として、公式より下記が挙げられています。

  • ダークモードサポート
  • カスタムダウンロードオプション
  • 並列ファイル処理とダウンロード
  • キュー内で複数の機能を実行するカスタム「パイプライン」
  • 外部スクリプトと統合するためのAPI
  • オプションのログインと認証のサポート
  • データベースのバックアップとインポート

英語を直訳しているので分かりにくいですが、通常利用であれば申し分ない機能性です。

PDF機能

ページ操作や変換などの具体的な機能一覧です。こちらも直訳なので雰囲気だけ感じ取れれば十分です。

本記事では使用方法を取り上げませんが、OCRやWord/PowerPoint/Excel/HTML変換、署名機能など、本当に無料でいいのか?と疑うレベルで凄まじい機能が充実しています。(好評の場合は各機能の使用方法をまとめようと思います)

ページ操作

  • PDFの表示と変更-カスタム表示、並べ替え、検索でマルチページのPDFを表示
  • さらに、注釈、描画、テキストや画像の追加などのページ上の編集機能
  • PDFとそのページをマージ/分割/回転/移動するための完全なインタラクティブGUI
  • 複数のPDFを単一の結果ファイルにマージする
  • PDFを指定されたページ番号で複数のファイルに分割するか、すべてのページを個別のファイルとして抽出します
  • PDFページをさまざまな順序に再編成
  • PDFを90度単位で回転
  • ページを削除
  • マルチページレイアウト(PDFをマルチページページにフォーマット)
  • 設定パーセンテージによるページのコンテンツサイズのスケール
  • コントラストを調整する
  • PDFの切り取り
  • PDFの自動分割(物理的にスキャンされたページディバイダーを使用)
  • ページを抽出する
  • PDFを単一のページに変換する
  • PDFを重ね合わせる

変換操作

  • PDFを画像との間で変換する
  • 一般的なファイルをPDFに変換します(LibreOfficeを使用)
  • PDFをWord / PowerPoint / othersに変換(LibreOfficeを使用)
  • HTMLをPDFに変換
  • PDFへのURL
  • PDFへのマークダウン

セキュリティと許可

  • パスワードを追加および削除
  • PDF権限の変更/設定
  • 透かしを追加
  • PDFの認証/署名
  • PDFをサニタイズ
  • 自動編集テキスト

その他の操作

  • 署名の追加/生成/書き込み
  • PDFを修復する
  • 空白のページを検出して削除する
  • 2つのPDFを比較し、テキストの違いを表示する
  • PDFに画像を追加
  • PDFを圧縮してファイルサイズを小さくします(OCRMyPDFを使用)
  • PDFから画像を抽出
  • スキャンから画像を抽出
  • ページ番号を追加
  • PDFヘッダーテキストを検出してファイルの名前を自動変更します
  • PDF上のOCR(OCRMyPDFを使用)
  • PDF / A変換(OCRMyPDFを使用)
  • メタデータを編集
  • 平準化されたPDF
  • JSONとして表示またはエクスポートするためにPDFのすべての情報を入手する
  • 埋め込まれたJavaScriptを表示/検出

インストール方法

さて、お待ちかねのインストール方法です。

Dockerのインストール

既にDockerをインストールされている方は飛ばしてください。

ここではWindowsでのインストール方法をザックリと説明しますので、具体的な手順は他のサイト(Qiita「Windows 11にDocker Desktopを入れる手順(令和5年最新版)」など)にお任せします。

Docker Desktopをインストールする

まず、以下のサイトからDocker Desktopをインストールしてください。

https://docs.docker.com/desktop/install/windows-install

青いボタンが2つありますが、選ぶのは「Docker Desktop for Windows – x86_64」の方です。(稀にもう片方を選ぶべき場合もありますが、普通の人はこちらです。)

Use WSL 2 instead of Hyper-V (recommended)

確認画面で「Use WSL 2 instead of Hyper-V (recommended)」にチェックが入った画面が出てくると思います。そちらは必ずチェックをつけたまま、続けてください。

あとは全部OK

残りは何も考えずに「OK」「Accept」「Fin」などのボタンをクリックしていきましょう。

これでDockerの準備は完了です。

Stirling PDFのインストール

インストールというより立ち上げという表現の方が正しい気はしますが、あまり気にしないで進めていきます。

作業フォルダの作成

どこか適当な場所に、空のフォルダを作成しておきましょう。

そこがStirling PDFの作業フォルダとなります。

yamlファイルの作成

何も考えずに、以下をコピーして、先ほどのフォルダに「docker-compose.yml」という名前で保存しましょう。
※分からない場合は一度「docker-compose.yml.txt」などテキストファイルとして保存してしまって、名前の変更で「.txt」を削りましょう。

version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8080:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata # Required for extra OCR languages
      - ./extraConfigs:/configs
#      - ./customFiles:/customFiles/
#      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
      - LANGS=en_GB

Stirling PDFを立ち上げる

ここまで準備が完了したら、先ほどのフォルダをエクスプローラーで開いた状態で右クリックし、「ターミナルで開く」をクリックします。

黒い画面(プロンプト画面)が立ち上がったら、「docker-compose up -d」と入力します。

しばらくすると立ち上げが完了しますので、http://localhost:8080/?lang=ja_JP にアクセスすると、無事に入ることができるはずです。

ちなみに、PCを再起動する度に、「ターミナルで開く」→「docker-compose up -d」は必要になりますのでご注意を。

いじってみた

実際に使っていただければ凄さが体感できるのですが、今回はmdファイルをPDFファイルに変換するという珍しい機能を使ってみました。

使用するmdファイルはコチラ。(ダークモードなので背景が黒くなっています。)

これを変換すると以下のようになりました。

これは素晴らしいですね。動作も一瞬で終わり、超快適でした。

よければ試してみてください。

データ

Posted by このめ