2行1データの画像データをOCRした結果
大量のスキャンデータを処理する必要があり、
OCRを片っ端から試してみました
「1行1データ」は割と色々なサイト・アプリで行けるのですが、
官公庁大好きな「2行が1データ」の書類です
lenz
結論から言うと、lenzが最も良かったです
chromeでpdfを読み込み、alt+DでURLバーにフォーカスするとショートカットが出るので、クリック。後は範囲選択でテキスト化できます。
恐らく制限はいつか来ると思いますが、連続で100回ぐらい読み取っても平気だったので、基本的には十分可と思います
gemini 2.0 flash thinking
chat系AIではこちらが最高でした。
OCRは完璧ですが、「完了しました」の「完了」だけがロシア語や韓国語になるのが不穏でした。
害はありませんが、翻訳がほんの少し面倒でした。
結構使ったと思いますが、制限が来なかったのが不思議です。量が多い場合はgeminiが良いでしょう。
chatGPT o1
こちらもgeminiと並んで非常に精度が高いです。
ただ、上限が思ったよりも早く来てしまいます。pro使いならこちらで十分だと思います
chatGPT o3 mini、mini-high
だめです。o1より大分精度が下がってしまいます。
chatGPT 4o
だめです。エラー多発で使い物になりませんでした。
昔はOCRできたのですが、いつからか使えなくなっています
google drive+google document
一時流行った無料のOCR
過去は無料で無制限に使えるので重宝していましたが、
2行ずつのデータは惨敗でした。
ezocr
内部的にgooglelenzを使っているようです。
googlelenzで良いじゃんとなりますが、実際そうです。
UIが充実しているので、chromeをpdfでよみこむのが面倒な方にはいいかもしれません。
ただ、10ページ以降は有料なので用途は限られます。
https://ezocr.net/OCR
acrobat
期待しましたが、2行ずつのデータは苦手のようです。残念。
https://www.adobe.com/jp/acrobat/online/ocr-pdf.html
pdf24
無料サイトの中ではまだ良い方ですが、
chatGPTやgemini、lenzには遠く及ばず
https://tools.pdf24.org/ja/
ilovepdf
何故か数字が全部丸付き数字になる上に半角スペース付き、
スキャンからEXCELへの変換は有料だったりと高くて酷い。日本語が苦手なのかもしれません。
第13865号
↓
第 ① ③ S ⑥ ⑤ 号
pdfcandy、smallpdf
エラー多発で使えませんでした。
livepolls.app
googledriveで接続できるアプリ。1枚50円と高額なのでご遠慮しました。
性能は不明です。
読取革命
体験版を使ってみましたが、無料サイト同等レベルで今ひとつ
ローカル+買い切りなので、整ったデータを大量にテキストにする場合には使えると思います
ディスカッション
コメント一覧
まだ、コメントがありません