Featured image of post PDFから表データを簡単に取り出したい

PDFから表データを簡単に取り出したい

報告書や調査票の PDF から、再利用できる表を抜き出したいときの解決パターン

レポートや行政資料の PDF に表はあるものの、CSV や Excel に再入力せず取り出したいケースです。

解決方法

まず PDF の中で表として認識できる領域を選び、行列構造を保ったまま抽出します。抽出後に列名や空白を整える前提で、表そのものを早く取り出すことが重要です。

使うツール

向いているケース

  • 行政資料の再利用
  • 調査レポートの表抽出
  • 手入力をなるべくなくしたいとき