frame_decoration

「入門者の Tesseract」の編集履歴(バックアップ)一覧に戻る

入門者の Tesseract - (2019/07/25 (木) 21:45:30) の編集履歴(バックアップ)


Tesseract とは

Tesseract(テッセラクト)は 光学文字認識(OCR) のエンジン。名称の Tesseract とは 四次元超立方体 の意。多様なOS上で動作する オープンソース ソフトウェアであり、Apache License 2.0 の下で配布。バージョン4.0 からは、従来の認識エンジンに加え LSTM ベースの ニューラルネットワーク によるエンジンが搭載されている。

1985年、Hewlett Packard(ヒューレット・パッカード)のラボで開発。作者は Ray Smith。2005年にオープンソースとしてリリース。2006年以後グーグルによって支援。バージョン3 では言語サポートが大幅に拡張され、中国語(簡体字および繁体字)、日本語、韓国語などに対応。2018年10月リリースのバージョン4.0 では、合計116の言語をサポート。

Linux、Windows および Mac OS X で利用可能(追記:Android 上で動くことを確認)。実行は コマンドラインインターフェース からおこなう。オリジナルには GUI は付属しないが、かわりに提供するプロジェクトが数多くある。

公式コードの GitHub リポジトリ
https://github.com/tesseract-ocr/tesseract


(メモ:YouTube などで検索するばあい、同名のロックバンドが上位にヒットするので、「Tesseract-ocr」のように OCR であることを明記するのがベター。ちなみに、日本語の動画はまだないもよう。ハングルと中国語がちらほらで、ほとんどが英語もの。サンスクリット語の動画もあり)


Tesseract wiki とは


OCR とは

LSTM とは


Google 翻訳とは



2019-06-08:公開
2019-07-25:更新
しだひろし/PoorBook G3'99

カウンタ: -

  • フリーの OCR ソフト「Tesseract」の公式 wiki サイトを Google 翻訳して、markdown 形式で対照してみました。 -- しだ (2019-06-08 21:45:44)
  • markdown モードのままではカウンタやコメント機能をいかせないので、アットウィキモードのページへ取り込み(include、最大70個まで)。 -- しだ (2019-06-09 23:09:20)
  • 取り込み元のページを閲覧不可にすると、取り込み先のページでもその部分は非表示になるもよう。当然といえば当然か。。。 -- しだ (2019-06-10 19:58:19)
  • ものは試しに、markdown モードでカウンタとコメントの wiki 用 タグ プラグインをつけてみたが、やはり不可。 -- しだ (2019-06-10 20:05:19)
  • ページ名頭のブラケットタグ [翻訳] を [対訳] に変更しました。今後、翻訳の修正をほどこしたうえで、別ページをアップする予定。 -- しだ (2019-06-12 20:32:39)
  • [対訳] は Google 翻訳の出力結果を基本そのままで。現時点でおかしな翻訳のクセがあるので、それをさらすのがねらい。 -- しだ (2019-06-12 20:51:33)
名前:
コメント: