「[対訳] LSTM 4.0付き」の編集履歴(バックアップ)一覧はこちら
「[対訳] LSTM 4.0付き」(2019/06/12 (水) 20:24:50) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
original (2019/05/14 付) | Google 翻訳 (2019/05/17 付)
---------- | ------------
## 4.0 | ## 4.0
|
Tesseract 4.0 **rc** source code is available in the 'master' branch of the [repository](https://github.com/tesseract-ocr/tesseract). It adds a new OCR engine based on LSTM neural networks. It initially works (well) on x86/Linux. Model data for 101 languages is available in the [tessdata repository](https://github.com/tesseract-ocr/tessdata). | Tesseract 4.0 **rc**ソースコードは[リポジトリ]のマスターブランチ(https://github.com/tesseract-ocr/tesseract)にあります。それはLSTMニューラルネットワークに基づく新しいOCRエンジンを追加します。最初はx86 / Linuxで(うまく)動作しています。 101の言語のモデルデータは[tessdata repository](https://github.com/tesseract-ocr/tessdata)にあります。
|
## Documentation | ## ドキュメンテーション
* [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) | * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00)
* [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) | * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs)
* [DAS 2016 tutorial slides](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) | * [DAS 2016チュートリアルスライド](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016)
Slides | スライド
[#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf), | [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf)、
[#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf), | [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf)、
[#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) | [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf)
have information about LSTM integration in Tesseract 4.0. | Tesseract 4.0でのLSTM統合についての情報があります。
|
* [4.0 Accuracy and Performance](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | * [4.0精度とパフォーマンス](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance)
|
## Training Tesseract LSTM engine | ##トレーニングTesseract LSTMエンジン
|
* [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00)
|
3.0 version of box files can be converted for use with LSTM training by adding a tab character at end of each line and boxes with space after each word. `Mark EOL` and `Mark EOL Bulk` functions under `Edit` in `Box Editor` tab of latest version of [jTessBoxEditor - jTessBoxEditor-2.0-Beta](https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/) can be used to add the EOL tabs automatically. Insert mode can be used on last letter of each word to add a box with space. There is no automated way to do this. | ボックスファイルの3.0バージョンは、各行の末尾にタブ文字を追加し、各単語の後にスペースを含むボックスを追加することで、LSTMトレーニングで使用するために変換できます。 [jTessBoxEditor - jTessBoxEditor-2.0-Beta]の最新版の[ボックスエディタ]タブの[編集]の下にある[マークEOL]および[マークEOL一括]機能(https://sourceforge.net/projects/vietocr/files/jTessBoxEditor) /)を使用してEOLタブを自動的に追加できます。各単語の最後の文字に挿入モードを使用して、スペース付きのボックスを追加できます。これを自動化する方法はありません。
|
## 4.0.0-alpha ppa | ## 4.0.0-alpha ppa
|
Unofficial Ubuntu PPAs for Tesseract 4.00 & Leptonica 1.74: | Tesseract 4.00およびLeptonica 1.74用の非公式Ubuntu PPA:
* https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr
|
Leptonica 1.74.1 package for Debian: | Debian用Leptonica 1.74.1パッケージ:
* https://packages.debian.org/sid/libleptonica-dev | * https://packages.debian.org/sid/libleptonica-dev
|
|
## 4.0.0-alpha for Windows | Windows用## 4.0.0-alpha
|
Unofficial experimental binaries of tesseract-ocr 4.0.0-alpha are available from the following links. Each one is from a different commit from master branch in early 2017. See individual sites for more details: | tesseract-ocr 4.0.0-alphaの非公式の実験的バイナリは以下のリンクから入手可能です。それぞれが2017年初めのマスターブランチからの異なるコミットからのものです。詳細については個々のサイトを参照してください。
|
* [Windows Installer made with MinGW-w64](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe) from [UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki) | * [MinGW-w64で作られたWindowsインストーラ](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe)[UB Mannheim](https:// github) .com / UB-Mannheim / tesseract / wiki)
* [zip file with cppan generated .dll and .exe files](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1), You have to install VC2015 x86 redist from microsoft.com in order to run them. | * [cppanで生成された.dllおよび.exeファイルのzipファイル](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1)、VC2015 x86をインストールする必要がありますそれらを実行するためにmicrosoft.comから再リストします。
* [Win64 build of tesseract 4.0.0 alpha, leptonica 1.74.1, and charlesw/tesseract .Net wrapper](https://github.com/tdhintz/tesseract4win64) - built using CPPAN for Visual Studio 2017. | * [Win64のtesseract 4.0.0 alpha、leptonica 1.74.1、およびcharlesw / tesseract .Netラッパーのビルド](https://github.com/tdhintz/tesseract4win64) - Visual Studio 2017用のCPPANを使用してビルドされました。
|
## 4.0.0-alpha with GUI frontend | GUIフロントエンドを備えた## 4.0.0-alpha
|
### VietOCR | ### VietOCR
[Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for VietOCR](https://sourceforge.net/projects/vietocr/files/vietocr/) from | [GUIインタフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはVietOCRで利用可能](https://sourceforge.net/projects/vietocr/files/vietocr/)から
|
* [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/)
|
* [Visual C++ Redistributable for Visual Studio 2015 runtime - vc_redist.x86.exe](https://www.microsoft.com/en-us/download/details.aspx?id=48145) is REQUIRED for VietOCR to run correctly. | * [Visual C ++再配布可能なVisual Studio 2015ランタイム - vc_redist.x86.exe](https://www.microsoft.com/ja-jp/download/details.aspx?id=48145)はVietOCRを正しく実行するために必要です。
|
VietOCR can be used to download appropriate 4.0.0alpha traineddata for additional languages. | VietOCRを使用して、追加の言語用に適切な4.0.0alphaトレーニングデータをダウンロードできます。
|
|
### gImageReader | ### gImageReader
|
[Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for gImageReader](https://github.com/manisandro/gImageReader/releases) from | [GUIインターフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはgImageReaderで利用可能](https://github.com/manisandro/gImageReader/releases)から
* [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5)
* [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.g.exe.exe)
|
Download 4.0.0alpha traineddata to use with the above from master branch of tessdata. e.g. for Hindi download the following file: | tessdataのmasterブランチから上記で使用するために4.0.0alpha traineddataをダウンロードしてください。例えばヒンディー語で次のファイルをダウンロードします。
|
https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata
* | *
|
## 3.05-dev | ## 3.05-dev
|
The [3.05 branch on GitHub] (https://github.com/tesseract-ocr/tesseract/tree/3.05) can be used by those who want the bug fixes for 3.05.01 release. | [GitHubの3.05ブランチ](https://github.com/tesseract-ocr/tesseract/tree/3.05)は、3.05.01リリースのバグ修正をしたい人が使用できます。
|
An unofficial installer for Tesseract 3.05-dev for Windows is available from [Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki). This includes the training tools. | Windows用のTesseract 3.05-devの非公式インストーラーは[Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki)から入手できます。これにはトレーニングツールが含まれます。
|
## Current official release | ##現在の公式リリース
|
The current official release is [3.05.01](https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01). | 現在の公式リリースは[3.05.01]です(https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01)。## 中見出し
original (2019/05/14 付) | Google 翻訳 (2019/05/17 付)
---------- | ------------
## 4.0 | ## 4.0
|
Tesseract 4.0 **rc** source code is available in the 'master' branch of the [repository](https://github.com/tesseract-ocr/tesseract). It adds a new OCR engine based on LSTM neural networks. It initially works (well) on x86/Linux. Model data for 101 languages is available in the [tessdata repository](https://github.com/tesseract-ocr/tessdata). | Tesseract 4.0 **rc**ソースコードは[リポジトリ]のマスターブランチ(https://github.com/tesseract-ocr/tesseract)にあります。それはLSTMニューラルネットワークに基づく新しいOCRエンジンを追加します。最初はx86 / Linuxで(うまく)動作しています。 101の言語のモデルデータは[tessdata repository](https://github.com/tesseract-ocr/tessdata)にあります。
|
## Documentation | ## ドキュメンテーション
* [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) | * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00)
* [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) | * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs)
* [DAS 2016 tutorial slides](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) | * [DAS 2016チュートリアルスライド](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016)
Slides | スライド
[#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf), | [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf)、
[#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf), | [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf)、
[#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) | [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf)
have information about LSTM integration in Tesseract 4.0. | Tesseract 4.0でのLSTM統合についての情報があります。
|
* [4.0 Accuracy and Performance](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | * [4.0精度とパフォーマンス](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance)
|
## Training Tesseract LSTM engine | ##トレーニングTesseract LSTMエンジン
|
* [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00)
|
3.0 version of box files can be converted for use with LSTM training by adding a tab character at end of each line and boxes with space after each word. `Mark EOL` and `Mark EOL Bulk` functions under `Edit` in `Box Editor` tab of latest version of [jTessBoxEditor - jTessBoxEditor-2.0-Beta](https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/) can be used to add the EOL tabs automatically. Insert mode can be used on last letter of each word to add a box with space. There is no automated way to do this. | ボックスファイルの3.0バージョンは、各行の末尾にタブ文字を追加し、各単語の後にスペースを含むボックスを追加することで、LSTMトレーニングで使用するために変換できます。 [jTessBoxEditor - jTessBoxEditor-2.0-Beta]の最新版の[ボックスエディタ]タブの[編集]の下にある[マークEOL]および[マークEOL一括]機能(https://sourceforge.net/projects/vietocr/files/jTessBoxEditor) /)を使用してEOLタブを自動的に追加できます。各単語の最後の文字に挿入モードを使用して、スペース付きのボックスを追加できます。これを自動化する方法はありません。
|
## 4.0.0-alpha ppa | ## 4.0.0-alpha ppa
|
Unofficial Ubuntu PPAs for Tesseract 4.00 & Leptonica 1.74: | Tesseract 4.00およびLeptonica 1.74用の非公式Ubuntu PPA:
* https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr
|
Leptonica 1.74.1 package for Debian: | Debian用Leptonica 1.74.1パッケージ:
* https://packages.debian.org/sid/libleptonica-dev | * https://packages.debian.org/sid/libleptonica-dev
|
|
## 4.0.0-alpha for Windows | Windows用## 4.0.0-alpha
|
Unofficial experimental binaries of tesseract-ocr 4.0.0-alpha are available from the following links. Each one is from a different commit from master branch in early 2017. See individual sites for more details: | tesseract-ocr 4.0.0-alphaの非公式の実験的バイナリは以下のリンクから入手可能です。それぞれが2017年初めのマスターブランチからの異なるコミットからのものです。詳細については個々のサイトを参照してください。
|
* [Windows Installer made with MinGW-w64](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe) from [UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki) | * [MinGW-w64で作られたWindowsインストーラ](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe)[UB Mannheim](https:// github) .com / UB-Mannheim / tesseract / wiki)
* [zip file with cppan generated .dll and .exe files](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1), You have to install VC2015 x86 redist from microsoft.com in order to run them. | * [cppanで生成された.dllおよび.exeファイルのzipファイル](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1)、VC2015 x86をインストールする必要がありますそれらを実行するためにmicrosoft.comから再リストします。
* [Win64 build of tesseract 4.0.0 alpha, leptonica 1.74.1, and charlesw/tesseract .Net wrapper](https://github.com/tdhintz/tesseract4win64) - built using CPPAN for Visual Studio 2017. | * [Win64のtesseract 4.0.0 alpha、leptonica 1.74.1、およびcharlesw / tesseract .Netラッパーのビルド](https://github.com/tdhintz/tesseract4win64) - Visual Studio 2017用のCPPANを使用してビルドされました。
|
## 4.0.0-alpha with GUI frontend | GUIフロントエンドを備えた## 4.0.0-alpha
|
### VietOCR | ### VietOCR
[Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for VietOCR](https://sourceforge.net/projects/vietocr/files/vietocr/) from | [GUIインタフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはVietOCRで利用可能](https://sourceforge.net/projects/vietocr/files/vietocr/)から
|
* [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/)
|
* [Visual C++ Redistributable for Visual Studio 2015 runtime - vc_redist.x86.exe](https://www.microsoft.com/en-us/download/details.aspx?id=48145) is REQUIRED for VietOCR to run correctly. | * [Visual C ++再配布可能なVisual Studio 2015ランタイム - vc_redist.x86.exe](https://www.microsoft.com/ja-jp/download/details.aspx?id=48145)はVietOCRを正しく実行するために必要です。
|
VietOCR can be used to download appropriate 4.0.0alpha traineddata for additional languages. | VietOCRを使用して、追加の言語用に適切な4.0.0alphaトレーニングデータをダウンロードできます。
|
|
### gImageReader | ### gImageReader
|
[Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for gImageReader](https://github.com/manisandro/gImageReader/releases) from | [GUIインターフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはgImageReaderで利用可能](https://github.com/manisandro/gImageReader/releases)から
* [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5)
* [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.g.exe.exe)
|
Download 4.0.0alpha traineddata to use with the above from master branch of tessdata. e.g. for Hindi download the following file: | tessdataのmasterブランチから上記で使用するために4.0.0alpha traineddataをダウンロードしてください。例えばヒンディー語で次のファイルをダウンロードします。
|
https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata
* | *
|
## 3.05-dev | ## 3.05-dev
|
The [3.05 branch on GitHub] (https://github.com/tesseract-ocr/tesseract/tree/3.05) can be used by those who want the bug fixes for 3.05.01 release. | [GitHubの3.05ブランチ](https://github.com/tesseract-ocr/tesseract/tree/3.05)は、3.05.01リリースのバグ修正をしたい人が使用できます。
|
An unofficial installer for Tesseract 3.05-dev for Windows is available from [Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki). This includes the training tools. | Windows用のTesseract 3.05-devの非公式インストーラーは[Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki)から入手できます。これにはトレーニングツールが含まれます。
|
## Current official release | ##現在の公式リリース
|
The current official release is [3.05.01](https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01). | 現在の公式リリースは[3.05.01]です(https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01)。