2行1データの画像データをOCRした結果

大量のスキャンデータを処理する必要があり、
OCRを片っ端から試してみました

「1行1データ」は割と色々なサイト・アプリで行けるのですが、
官公庁大好きな「2行が1データ」の書類です

lenz

結論から言うと、lenzが最も良かったです
chromeでpdfを読み込み、alt+DでURLバーにフォーカスするとショートカットが出るので、クリック。後は範囲選択でテキスト化できます。
恐らく制限はいつか来ると思いますが、連続で100回ぐらい読み取っても平気だったので、基本的には十分可と思います

gemini 2.0 flash thinking

chat系AIではこちらが最高でした。
OCRは完璧ですが、「完了しました」の「完了」だけがロシア語や韓国語になるのが不穏でした。
害はありませんが、翻訳がほんの少し面倒でした。
結構使ったと思いますが、制限が来なかったのが不思議です。量が多い場合はgeminiが良いでしょう。

chatGPT o1

こちらもgeminiと並んで非常に精度が高いです。
ただ、上限が思ったよりも早く来てしまいます。pro使いならこちらで十分だと思います

chatGPT o3 mini、mini-high

だめです。o1より大分精度が下がってしまいます。

chatGPT 4o

だめです。エラー多発で使い物になりませんでした。
昔はOCRできたのですが、いつからか使えなくなっています

google drive+google document

一時流行った無料のOCR
過去は無料で無制限に使えるので重宝していましたが、
2行ずつのデータは惨敗でした。

ezocr

内部的にgooglelenzを使っているようです。
googlelenzで良いじゃんとなりますが、実際そうです。
UIが充実しているので、chromeをpdfでよみこむのが面倒な方にはいいかもしれません。
ただ、10ページ以降は有料なので用途は限られます。
https://ezocr.net/OCR

acrobat

期待しましたが、2行ずつのデータは苦手のようです。残念。
https://www.adobe.com/jp/acrobat/online/ocr-pdf.html

pdf24

無料サイトの中ではまだ良い方ですが、
chatGPTやgemini、lenzには遠く及ばず
https://tools.pdf24.org/ja/

ilovepdf

何故か数字が全部丸付き数字になる上に半角スペース付き、
スキャンからEXCELへの変換は有料だったりと高くて酷い。日本語が苦手なのかもしれません。
第13865号

第 ① ③ S ⑥ ⑤ 号

pdfcandy、smallpdf

エラー多発で使えませんでした。

livepolls.app

googledriveで接続できるアプリ。1枚50円と高額なのでご遠慮しました。
性能は不明です。

読取革命

体験版を使ってみましたが、無料サイト同等レベルで今ひとつ
ローカル+買い切りなので、整ったデータを大量にテキストにする場合には使えると思います

未分類

Posted by admin8admin