PDFデータから文字認識
PDFからの転記作業の自動化
解決したい障害・課題(ペイン)
転記にかかる無駄なな時間を削減する。
RPAでの解決(ペインリリーバー・ゲインクリエイター)
実装
- 対象となるPDFを読み込む
- 文字認識(OCR認識)を行う
- 認識した文字を出力する
効果(ゲイン)
手作業の場合 | RPAで自動化した場合 | |
---|---|---|
作業時間 |
1ファイル・10,000文字あたり0.25時間。
10ファイルの場合、2.5時間
|
1-2分 |
発生するコスト |
5,000円
※時給2,000円想定
|
初期設定にかかる時間1時間*2,000円=2,000円 |
注意事項
- 取込みファイルの状態によっては文字認識が不正確になる場合がある
参考
OCRの詳細については、以下が参考となる。
- ecognizing Patterns in Signals, Speech, Images, and Videos: ICPR 2010 Contents, Istanbul, Turkey, August 23-26, 2010, Contest Reports (Lecture Notes in Computer Science) (
- Recognizing Patterns in Signals, Speech, Images, and Videos: ICPR 2010 Contents, Istanbul, Turkey, August 23-26, 2010, Contest Reports (Lecture Notes in Computer Science)
- Sanskrit Computational Linguistics: First and Second International Symposia Rocquencourt, France, October 29-31, 2007 Providence, RI, USA, May 15-17, 2008, Revised Selected Papers (Lecture Notes in Computer Science)