ドキュメント一覧へ戻る

Author: Claw-Navi Editorial Team|Published: 2026-03-11|Updated: 2026-03-11

nano-pdf 実務ガイド（実務強化版）

nano-pdf は、PDF ドキュメントからのテキスト抽出、要約、複数ファイルの比較分析を AI エージェントに実行させるための特化型スキルです。

1. 対象読者

長文の契約書や論文、報告書を毎日大量に読む必要がある専門職
過去の資料と最新の資料の差分を高速に確認したい法務・知財担当
社内 PDF 資産をデータベース化し、検索性を高めたい DX 推進者

2. 事前準備

Node.js 環境: PDF 解析用のライブラリが依存関係として必要。
解析対象の PDF: テキストレイヤーを持つ PDF（スキャン画像の場合は OCR スキルとの併用が必要）。

3. 実装手順

Step 1: スキル導入

openclaw install nano-pdf を実行。

Step 2: 入力ルールの定義

単一ファイルの解析か、フォルダ内の複数ファイルの一括処理かを指示。

Step 3: 出力フォーマットの設定

Markdown、JSON、要約テキストなど、後続の業務で使いやすい形式を指定します。

4. 失敗例と対処法

文字化け・解析不能: 複雑なレイアウトや特殊なフォントを使用している PDF。テキスト抽出エンジンを調整するか、画像を介した解析を検討してください。
トークン上限エラー: PDF が巨大すぎる場合、モデルのコンテキストウィンドウを超過します。ページ分割処理を指示に含めてください。

5. 再発防止

品質確認: 重要な数値（契約金額、日付など）については、AI の出力を盲信せず、必ず原本との突合を行う。
テンプレート化: 定型の報告書解析には、抽出項目を固定したプロンプトテンプレートを作成し、出力のブレを最小限にする。

6. KPI

読解・要約時間: 1ファイルあたりの平均処理時間。
情報の抽出精度: 人間が修正を必要とした箇所の少なさ。
検索ヒット率: PDF 内の情報がどれだけ迅速に業務に活用されたか。

7. FAQ

Q: スキャンした画像だけの PDF は読めますか？
- A: vision 系のモデルを使用するか、OCR 処理を前段に置く必要があります。
Q: セキュリティは大丈夫ですか？
- A: OpenClaw をローカル環境や自社 VPS で動かしている場合、データは自社の制御下にあります（外部 API モデルを使用する場合はその利用規約に従います）。

8. 参考リンク

PDF.js (Mozilla): https://mozilla.github.io/pdf.js/
OpenClaw Docs: https://docs.openclaw.ai