日々の業務の中で、紙の帳票を使用することはまだまだあるかと思います。
最初からスマートフォンなどで入力できればいいですが、農業の現場では手が汚れていて使えなかったり、作業をしながらだと両手をスマートフォン操作に使えなかったりと、紙のほうがまだ活用しやすい場面は多々あります。
それに、多くの農業経営者から言われることですが、年輩のかたはどうしてもスマートフォンよりは手書きを好むことがあります(そうした場合も、スマートフォンでの業務が効率化できていれば、最初の心理的ハードルさえ超えればあとはかえってデジタルのほうに移行してもらえることは多いですが)。
私が農業者を支援する中でよく出会うのは、仕訳帳・総勘定元帳のような財務関連の資料や、日報のような労務関連の資料を、紙(あるいは紙をスキャンしたもの)としてしかもっていないという状況です。
財務関連の資料は、税理士さんのほうではデジタルデータをもっているはずですが、それをもらうことはできない場合があります。
こうしたとき、以前は、パソコン入力が得意な人がひたすらエクセルなどに入力していくしかありませんでした。
しかし最近は、生成AIがかなり高い精度で文字認識し、デジタルデータにしてくれます。
手書き文字でも、多少崩れているくらいであれば案外正しく認識されます。
そのための簡単な手法を紹介します。
準備
用意するものは以下の2種類です。
- デジタル化したい資料の画像データ
- 集計用のエクセルフォーマット
当然ですが、デジタル化したい資料をスキャンもしくは写真撮影したものが必須です。
ふつうにスキャンをするとpdfになるかもしれませんが、手書きの文字をスキャンしたpdfファイルは生成AIの種類によってはうまく文字認識できないことがあるので、jpgなどの画像にしなければならない場合があります。
ChatGPTも、バージョンによってはpdfからの文字認識ができないかもしれません。
こうしたときには、iLovePDFなどのサービスを用いれば、pdfファイルをjpgファイルにすることができます。
https://www.ilovepdf.com/ja/pdf_to_jpg
集計用のエクセルフォーマットは、極力シンプルな形がいいです。
人がエクセルファイルを編集する場合は1行目やA列を空けておくことが多いですが、これをすると生成AIが少し混乱してしまうかもしれません。
上部の行を空けず、項目名は1行目に書いたほうが、生成AIがすんなりと理解してくれて作業スピードが速くなります。
以下のような感じです。
プロンプト
私が使用しているプロンプトは以下のようなものです。
今回は作業日報の集計を想定したプロンプトにしていますので、用途に応じて適宜アレンジを加えて使用してみてください。
# 指示
以降のメッセージでユーザーが送るjpgファイルの情報を読み取って、添付のエクセルファイル「日報集計」に反映し、更新したエクセルファイルをダウンロードできるようにしてください。
# 背景および目的
jpgファイルは従業員が毎日記入している日報です。
この情報を電子化することで集計を容易にし、どの作業にどのくらいの時間がかかっているのかといった分析や、いつどのような作業をしてどのような課題があったかの検索を効率化したいです。
# 説明
エクセルファイルの1行目には日報の項目名入力されています。
また、2行目はサンプルとして、本メッセージに添付した日報の最初の1枚の情報を反映していますので、2行目とこの画像を照らし合わせて入力方法を理解してください。
自由回答の項目に関しては、手書き文字からのOCRの内容を前後の文字と照らして適宜修正し、意味が通る文章にしてください。
このプロンプトにて集計を指示すると、かなりの精度でChatGPTが集計をしてくれます。
自由記述回答の手書き文字も、よほど雑なものでない限り、正しく認識してくれます。