「入門者の Tesseract」の編集履歴(バックアップ)一覧に戻る
入門者の Tesseract - (2019/07/25 (木) 21:47:50) の編集履歴(バックアップ)
Tesseract とは
1985年、
Hewlett Packard(ヒューレット・パッカード)のラボで開発。作者は
Ray Smith。2005年にオープンソースとしてリリース。2006年以後グーグルによって支援。バージョン3 では言語サポートが大幅に拡張され、中国語(簡体字および繁体字)、日本語、韓国語などに対応。2018年10月リリースのバージョン4.0 では、合計116の言語をサポート。
Linux、Windows および Mac OS X で利用可能(追記:Android 上で動くことを確認)。実行は
コマンドラインインターフェース からおこなう。オリジナルには GUI は付属しないが、かわりに提供するプロジェクトが数多くある。
(メモ:YouTube などで検索するばあい、同名のロックバンドが上位にヒットするので、「Tesseract-ocr」のように OCR であることを明記するのがベター。ちなみに、日本語の動画はまだないもよう。ハングルと中国語がちらほらで、ほとんどが英語もの。サンスクリット語の動画もあり)
Tesseract wiki とは
OCR とは
LSTM とは
Google 翻訳とは
2019-06-08:公開
2019-07-25:更新
しだひろし/PoorBook G3'99
カウンタ: -
- フリーの OCR ソフト「Tesseract」の公式 wiki サイトを Google 翻訳して、markdown 形式で対照してみました。 -- しだ (2019-06-08 21:45:44)
- markdown モードのままではカウンタやコメント機能をいかせないので、アットウィキモードのページへ取り込み(include、最大70個まで)。 -- しだ (2019-06-09 23:09:20)
- 取り込み元のページを閲覧不可にすると、取り込み先のページでもその部分は非表示になるもよう。当然といえば当然か。。。 -- しだ (2019-06-10 19:58:19)
- ものは試しに、markdown モードでカウンタとコメントの wiki 用
タグ プラグインをつけてみたが、やはり不可。 -- しだ (2019-06-10 20:05:19)
- ページ名頭のブラケットタグ [翻訳] を [対訳] に変更しました。今後、翻訳の修正をほどこしたうえで、別ページをアップする予定。 -- しだ (2019-06-12 20:32:39)
- [対訳] は Google 翻訳の出力結果を基本そのままで。現時点でおかしな翻訳のクセがあるので、それをさらすのがねらい。 -- しだ (2019-06-12 20:51:33)