top of page
AI-OCR Product
最新AI技術・画像処理技術を取り入れたOCRプログラム
FROG AI-OCR
明治期~昭和期までの複雑な資料のテキスト化が可能!
地域旧文書等の電子図書館・デジタルアーカイブ化、読書バリアフリー法対応へ!
<国立国会図書館次世代システム開発研究室様コメント>
今回の成果である日本語のOCR処理プログラム「NDLOCR」は、NDLラボ公式GitHubアカウント(https://github.com/ndl-lab )からオープンソースで令和4年4月25日に公開しました。NDLOCRは、学習用データを用意することで追加の学習が可能なOCRで、今後国立国会図書館がデジタル化する資料の全文テキストデータ作成に使用します。プログラムのほかに、開発に用いた機械学習用データセット(著作権保護期間が満了したデジタル化資料から作成した分のみ)も近々に公開予定です。日本語OCR全体の精度向上に資することになれば、と考えておりますので、関心のある多くの方々にご活用いただきたいと思っております。
※2022年4月28日リリースより抜粋
AIでテキスト化が素早く正確に
FROG AI-OCRは、最先端のAI技術と画像処理技術で
「テキスト化」を自動にするソリューションです
1860年代以降の書籍・雑誌において市販OCRより高い90%以上の精度で認識可能
特に明治期~昭和初期の近代書籍・雑誌においては、市販OCRの約2倍(約40%→90%以上)の読み取り精度
FROG-AI-OCRサービスサイトへ
bottom of page