frame_decoration

「[対訳] LSTM 4.0付き」の編集履歴(バックアップ)一覧はこちら

[対訳] LSTM 4.0付き」(2019/06/12 (水) 20:24:50) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

original (2019/05/14 付) | Google 翻訳 (2019/05/17 付) ---------- | ------------ ## 4.0 | ## 4.0 | Tesseract 4.0 **rc** source code is available in the 'master' branch of the [repository](https://github.com/tesseract-ocr/tesseract). It adds a new OCR engine based on LSTM neural networks. It initially works (well) on x86/Linux. Model data for 101 languages is available in the [tessdata repository](https://github.com/tesseract-ocr/tessdata). | Tesseract 4.0 **rc**ソースコードは[リポジトリ]のマスターブランチ(https://github.com/tesseract-ocr/tesseract)にあります。それはLSTMニューラルネットワークに基づく新しいOCRエンジンを追加します。最初はx86 / Linuxで(うまく)動作しています。 101の言語のモデルデータは[tessdata repository](https://github.com/tesseract-ocr/tessdata)にあります。 | ## Documentation | ## ドキュメンテーション * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) | * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) | * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) * [DAS 2016 tutorial slides](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) | * [DAS 2016チュートリアルスライド](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) Slides | スライド [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf), | [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf)、 [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf), | [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf)、 [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) | [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) have information about LSTM integration in Tesseract 4.0. | Tesseract 4.0でのLSTM統合についての情報があります。 | * [4.0 Accuracy and Performance](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | * [4.0精度とパフォーマンス](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | ## Training Tesseract LSTM engine | ##トレーニングTesseract LSTMエンジン | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | 3.0 version of box files can be converted for use with LSTM training by adding a tab character at end of each line and boxes with space after each word. `Mark EOL` and `Mark EOL Bulk` functions under `Edit` in `Box Editor` tab of latest version of [jTessBoxEditor - jTessBoxEditor-2.0-Beta](https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/) can be used to add the EOL tabs automatically. Insert mode can be used on last letter of each word to add a box with space. There is no automated way to do this. | ボックスファイルの3.0バージョンは、各行の末尾にタブ文字を追加し、各単語の後にスペースを含むボックスを追加することで、LSTMトレーニングで使用するために変換できます。 [jTessBoxEditor - jTessBoxEditor-2.0-Beta]の最新版の[ボックスエディタ]タブの[編集]の下にある[マークEOL]および[マークEOL一括]機能(https://sourceforge.net/projects/vietocr/files/jTessBoxEditor) /)を使用してEOLタブを自動的に追加できます。各単語の最後の文字に挿入モードを使用して、スペース付きのボックスを追加できます。これを自動化する方法はありません。 | ## 4.0.0-alpha ppa | ## 4.0.0-alpha ppa | Unofficial Ubuntu PPAs for Tesseract 4.00 & Leptonica 1.74: | Tesseract 4.00およびLeptonica 1.74用の非公式Ubuntu PPA: * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | Leptonica 1.74.1 package for Debian: | Debian用Leptonica 1.74.1パッケージ: * https://packages.debian.org/sid/libleptonica-dev | * https://packages.debian.org/sid/libleptonica-dev | | ## 4.0.0-alpha for Windows | Windows用## 4.0.0-alpha | Unofficial experimental binaries of tesseract-ocr 4.0.0-alpha are available from the following links. Each one is from a different commit from master branch in early 2017. See individual sites for more details: | tesseract-ocr 4.0.0-alphaの非公式の実験的バイナリは以下のリンクから入手可能です。それぞれが2017年初めのマスターブランチからの異なるコミットからのものです。詳細については個々のサイトを参照してください。 | * [Windows Installer made with MinGW-w64](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe) from [UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki) | * [MinGW-w64で作られたWindowsインストーラ](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe)[UB Mannheim](https:// github) .com / UB-Mannheim / tesseract / wiki) * [zip file with cppan generated .dll and .exe files](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1), You have to install VC2015 x86 redist from microsoft.com in order to run them. | * [cppanで生成された.dllおよび.exeファイルのzipファイル](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1)、VC2015 x86をインストールする必要がありますそれらを実行するためにmicrosoft.comから再リストします。 * [Win64 build of tesseract 4.0.0 alpha, leptonica 1.74.1, and charlesw/tesseract .Net wrapper](https://github.com/tdhintz/tesseract4win64) - built using CPPAN for Visual Studio 2017. | * [Win64のtesseract 4.0.0 alpha、leptonica 1.74.1、およびcharlesw / tesseract .Netラッパーのビルド](https://github.com/tdhintz/tesseract4win64) - Visual Studio 2017用のCPPANを使用してビルドされました。 | ## 4.0.0-alpha with GUI frontend | GUIフロントエンドを備えた## 4.0.0-alpha | ### VietOCR | ### VietOCR [Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for VietOCR](https://sourceforge.net/projects/vietocr/files/vietocr/) from | [GUIインタフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはVietOCRで利用可能](https://sourceforge.net/projects/vietocr/files/vietocr/)から | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [Visual C++ Redistributable for Visual Studio 2015 runtime - vc_redist.x86.exe](https://www.microsoft.com/en-us/download/details.aspx?id=48145) is REQUIRED for VietOCR to run correctly. | * [Visual C ++再配布可能なVisual Studio 2015ランタイム - vc_redist.x86.exe](https://www.microsoft.com/ja-jp/download/details.aspx?id=48145)はVietOCRを正しく実行するために必要です。 | VietOCR can be used to download appropriate 4.0.0alpha traineddata for additional languages. | VietOCRを使用して、追加の言語用に適切な4.0.0alphaトレーニングデータをダウンロードできます。 | | ### gImageReader | ### gImageReader | [Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for gImageReader](https://github.com/manisandro/gImageReader/releases) from | [GUIインターフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはgImageReaderで利用可能](https://github.com/manisandro/gImageReader/releases)から * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5) * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.g.exe.exe) | Download 4.0.0alpha traineddata to use with the above from master branch of tessdata. e.g. for Hindi download the following file: | tessdataのmasterブランチから上記で使用するために4.0.0alpha traineddataをダウンロードしてください。例えばヒンディー語で次のファイルをダウンロードします。 | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata * | * | ## 3.05-dev | ## 3.05-dev | The [3.05 branch on GitHub] (https://github.com/tesseract-ocr/tesseract/tree/3.05) can be used by those who want the bug fixes for 3.05.01 release. | [GitHubの3.05ブランチ](https://github.com/tesseract-ocr/tesseract/tree/3.05)は、3.05.01リリースのバグ修正をしたい人が使用できます。 | An unofficial installer for Tesseract 3.05-dev for Windows is available from [Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki). This includes the training tools. | Windows用のTesseract 3.05-devの非公式インストーラーは[Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki)から入手できます。これにはトレーニングツールが含まれます。 | ## Current official release | ##現在の公式リリース | The current official release is [3.05.01](https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01). | 現在の公式リリースは[3.05.01]です(https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01)。## 中見出し
original (2019/05/14 付) | Google 翻訳 (2019/05/17 付) ---------- | ------------ ## 4.0 | ## 4.0 | Tesseract 4.0 **rc** source code is available in the 'master' branch of the [repository](https://github.com/tesseract-ocr/tesseract). It adds a new OCR engine based on LSTM neural networks. It initially works (well) on x86/Linux. Model data for 101 languages is available in the [tessdata repository](https://github.com/tesseract-ocr/tessdata). | Tesseract 4.0 **rc**ソースコードは[リポジトリ]のマスターブランチ(https://github.com/tesseract-ocr/tesseract)にあります。それはLSTMニューラルネットワークに基づく新しいOCRエンジンを追加します。最初はx86 / Linuxで(うまく)動作しています。 101の言語のモデルデータは[tessdata repository](https://github.com/tesseract-ocr/tessdata)にあります。 | ## Documentation | ## ドキュメンテーション * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) | * [NeuralNetsInTesseract4.00](NeuralNetsInTesseract4.00) * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) | * [VGSLSpecs](https://github.com/tesseract-ocr/tesseract/wiki/VGSLSpecs) * [DAS 2016 tutorial slides](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) | * [DAS 2016チュートリアルスライド](https://github.com/tesseract-ocr/docs/tree/master/das_tutorial2016) Slides | スライド [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf), | [#2](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/2ArchitectureAndDataStructures.pdf)、 [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf), | [#6](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf)、 [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) | [#7](https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/7Building%20a%20Multi-Lingual%20OCR%20Engine.pdf) have information about LSTM integration in Tesseract 4.0. | Tesseract 4.0でのLSTM統合についての情報があります。 | * [4.0 Accuracy and Performance](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | * [4.0精度とパフォーマンス](https://github.com/tesseract-ocr/tesseract/wiki/4.0-Accuracy-and-Performance) | ## Training Tesseract LSTM engine | ##トレーニングTesseract LSTMエンジン | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | * [TrainingTesseract 4.00](https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00) | 3.0 version of box files can be converted for use with LSTM training by adding a tab character at end of each line and boxes with space after each word. `Mark EOL` and `Mark EOL Bulk` functions under `Edit` in `Box Editor` tab of latest version of [jTessBoxEditor - jTessBoxEditor-2.0-Beta](https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/) can be used to add the EOL tabs automatically. Insert mode can be used on last letter of each word to add a box with space. There is no automated way to do this. | ボックスファイルの3.0バージョンは、各行の末尾にタブ文字を追加し、各単語の後にスペースを含むボックスを追加することで、LSTMトレーニングで使用するために変換できます。 [jTessBoxEditor - jTessBoxEditor-2.0-Beta]の最新版の[ボックスエディタ]タブの[編集]の下にある[マークEOL]および[マークEOL一括]機能(https://sourceforge.net/projects/vietocr/files/jTessBoxEditor) /)を使用してEOLタブを自動的に追加できます。各単語の最後の文字に挿入モードを使用して、スペース付きのボックスを追加できます。これを自動化する方法はありません。 | ## 4.0.0-alpha ppa | ## 4.0.0-alpha ppa | Unofficial Ubuntu PPAs for Tesseract 4.00 & Leptonica 1.74: | Tesseract 4.00およびLeptonica 1.74用の非公式Ubuntu PPA: * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | * https://launchpad.net/~alex-p/+archive/ubuntu/tesseract-ocr | Leptonica 1.74.1 package for Debian: | Debian用Leptonica 1.74.1パッケージ: * https://packages.debian.org/sid/libleptonica-dev | * https://packages.debian.org/sid/libleptonica-dev | | ## 4.0.0-alpha for Windows | Windows用## 4.0.0-alpha | Unofficial experimental binaries of tesseract-ocr 4.0.0-alpha are available from the following links. Each one is from a different commit from master branch in early 2017. See individual sites for more details: | tesseract-ocr 4.0.0-alphaの非公式の実験的バイナリは以下のリンクから入手可能です。それぞれが2017年初めのマスターブランチからの異なるコミットからのものです。詳細については個々のサイトを参照してください。 | * [Windows Installer made with MinGW-w64](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe) from [UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki) | * [MinGW-w64で作られたWindowsインストーラ](http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe)[UB Mannheim](https:// github) .com / UB-Mannheim / tesseract / wiki) * [zip file with cppan generated .dll and .exe files](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1), You have to install VC2015 x86 redist from microsoft.com in order to run them. | * [cppanで生成された.dllおよび.exeファイルのzipファイル](https://www.dropbox.com/s/obiqvrt4m53pmoz/tesseract-4.0.0-alpha.zip?dl=1)、VC2015 x86をインストールする必要がありますそれらを実行するためにmicrosoft.comから再リストします。 * [Win64 build of tesseract 4.0.0 alpha, leptonica 1.74.1, and charlesw/tesseract .Net wrapper](https://github.com/tdhintz/tesseract4win64) - built using CPPAN for Visual Studio 2017. | * [Win64のtesseract 4.0.0 alpha、leptonica 1.74.1、およびcharlesw / tesseract .Netラッパーのビルド](https://github.com/tdhintz/tesseract4win64) - Visual Studio 2017用のCPPANを使用してビルドされました。 | ## 4.0.0-alpha with GUI frontend | GUIフロントエンドを備えた## 4.0.0-alpha | ### VietOCR | ### VietOCR [Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for VietOCR](https://sourceforge.net/projects/vietocr/files/vietocr/) from | [GUIインタフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはVietOCRで利用可能](https://sourceforge.net/projects/vietocr/files/vietocr/)から | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [VietOCR5.0alpha](https://sourceforge.net/projects/vietocr/files/vietocr/5.0alpha/) | * [Visual C++ Redistributable for Visual Studio 2015 runtime - vc_redist.x86.exe](https://www.microsoft.com/en-us/download/details.aspx?id=48145) is REQUIRED for VietOCR to run correctly. | * [Visual C ++再配布可能なVisual Studio 2015ランタイム - vc_redist.x86.exe](https://www.microsoft.com/ja-jp/download/details.aspx?id=48145)はVietOCRを正しく実行するために必要です。 | VietOCR can be used to download appropriate 4.0.0alpha traineddata for additional languages. | VietOCRを使用して、追加の言語用に適切な4.0.0alphaトレーニングデータをダウンロードできます。 | | ### gImageReader | ### gImageReader | [Windows binaries of tesseract-ocr 4.0.0-alpha with GUI interface are available for gImageReader](https://github.com/manisandro/gImageReader/releases) from | [GUIインターフェースを備えたtesseract-ocr 4.0.0-alphaのWindowsバイナリはgImageReaderで利用可能](https://github.com/manisandro/gImageReader/releases)から * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_i686_tesseract4.0.0.git2f10be5) * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe) | * [gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.git2f10be5.exe](https://github.com/manisandro/gImageReader/releases/download/v3.2.1/gImageReader_3.2.1_qt5_x86_64_tesseract4.0.0.g.exe.exe) | Download 4.0.0alpha traineddata to use with the above from master branch of tessdata. e.g. for Hindi download the following file: | tessdataのmasterブランチから上記で使用するために4.0.0alpha traineddataをダウンロードしてください。例えばヒンディー語で次のファイルをダウンロードします。 | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata | https://github.com/tesseract-ocr/tessdata/blob/master/hin.traineddata * | * | ## 3.05-dev | ## 3.05-dev | The [3.05 branch on GitHub] (https://github.com/tesseract-ocr/tesseract/tree/3.05) can be used by those who want the bug fixes for 3.05.01 release. | [GitHubの3.05ブランチ](https://github.com/tesseract-ocr/tesseract/tree/3.05)は、3.05.01リリースのバグ修正をしたい人が使用できます。 | An unofficial installer for Tesseract 3.05-dev for Windows is available from [Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki). This includes the training tools. | Windows用のTesseract 3.05-devの非公式インストーラーは[Tesseract at UB Mannheim](https://github.com/UB-Mannheim/tesseract/wiki)から入手できます。これにはトレーニングツールが含まれます。 | ## Current official release | ##現在の公式リリース | The current official release is [3.05.01](https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01). | 現在の公式リリースは[3.05.01]です(https://github.com/tesseract-ocr/tesseract/releases/tag/3.05.01)。

表示オプション

横に並べて表示:
変化行の前後のみ表示: