「青空文庫のまとめEpubの作り方」の編集履歴(バックアップ)一覧はこちら
青空文庫のまとめEpubの作り方 - (2012/08/25 (土) 12:49:01) の1つ前との変更点
追加された行は緑色になります。
削除された行は赤色になります。
**青空文庫テキストの入手
-DVDから入手> http://d.hatena.ne.jp/Koumei_S/20090307/1236419281
--利点:ファイル名が日本語なのでそのままタイトルに使える
--欠点:最新のものは当然含まれない
-一括ダウンロード>http://hpcgi1.nifty.com/hongming/komorebi/wforum.cgi?mode=allread&pastlog=0002&no=1352&page=10&act=past
--利点:最新ファイルが含まれる
--欠点:ファイル名がローマ字で連番が頭にあるのが多いので変換しなければならない
---&ref(ファイル先頭文字をファイル名に.wsf)のようなスクリプトでファイルの先頭文字をファイル名に付ける手はある
**テキストの結合
このページに添付した &ref(textMerge.bat) を使う例で説明すると
青空文庫textだけのフォルダを作り
&ref(textMerge.bat)をフォルダに置いて、そこに 青空文庫textのフォルダをD&D
textMerge.bat のフォルダに text.txt と title.txtが出来る
text.txtの頭に
タイトル
空行
作者名
を入れる
青空文庫を解凍した時に出来る画像ファイルを同じフォルダに入れる
**タグの修正
AozoraEpub3が認識出来るようにしましょう
-ゴシック体 -> 太字 に置換します(その内EPub3が対応するかもしれないので気にならないならそのまま)
-1行だけ指定のタグの一部
--これは正規文字列置換が出来るエディタを使う必要があります(例:K2Editor等)
例:
検索語=>[#改行天付き、折り返して1字下げ]\n(.*)\n
置換語=>[#ここから改行天付き、折り返して1字下げ]\n\1\n[#ここで字下げ終わり]\n
**表紙の作成
画像ファイルが入っていると自動的にソレが表紙になってしまうので
1つでも画像ファイルがあるテキストは表紙を作ってやりませよう
表紙.jpgのようなファイル名にし text.txt に
[#表紙(表紙.jpg)]
というタグをタイトル類の後に入れます
**AozoraEpub3で変換
-1 AozoraEpub3を用意> http://www18.atwiki.jp/hmdev/pages/21.html
-2 AozoraEpub3を起動(起動しないならJAVAをインストール) ダメなら
cd /d %~dp0
start /MIN java -jar AozoraEpub3.jar "%1"
という内容のbatをAozoraEpub3のフォルダに作ってそのバッチを起動
-3 結合textを起動したAozoraEpub3にD&D
-4 エラーや警告が出たら 結合textを修正
-5 出来たepub3のファイル拡張子に.zip を追加
-6 圧縮解凍ツールで そのzip を確認し 500kbyte以上のshtmlファイルが出来ていれば結合textに[#改ページ]を適時追加して分割させなおせよう
-7 変換に利用した結合textと画像ファイルをこのzipに入れておきましょう
-8 zipの拡張子を取ります
**epubファイルに元textを入れておく理由
-元ファイルを一緒に入れておけば問題があっても誰でも対応出来ます
-AozoraEpub3は頻繁に改善されています。 今問題があってもAozraEpub3が対応したらepub拡張子を.zipにしてAozoraEpub3に通すだけで改善されるかも
*textMerge.batの中身
このwikiのバッチやスクリプトは誰でも置換えられるので、ダウンロードしたら実行する前に中身を確認しましょう
cd /d %~dp0
cd
if %1 == / goto :SUB
pause このBATファイルと同じフォルダに text.txtとtitle.txtを作ります
:BASE
del text.txt
del title.txt
for %%I in (%1\*.txt) do textMerge.bat / "%%I" %%~nI
goto :EXIT
:SUB
echo;[#改ページ]>>text.txt
echo;■%3%4%5%6 >>text.txt
echo;■%3%4%5%6>>title.txt
type %2 >>text.txt
echo;>>text.txt
:EXIT
**青空文庫テキストの入手
-DVDから入手> http://d.hatena.ne.jp/Koumei_S/20090307/1236419281
--利点:ファイル名が日本語なのでそのままタイトルに使える
--欠点:最新のものは当然含まれない
-一括ダウンロード>http://hpcgi1.nifty.com/hongming/komorebi/wforum.cgi?mode=allread&pastlog=0002&no=1352&page=10&act=past
--利点:最新ファイルが含まれる
--欠点:ファイル名がローマ字で連番が頭にあるのが多いので変換しなければならない
---&ref(ファイル先頭文字をファイル名に.wsf)のようなスクリプトでファイルの先頭文字をファイル名に付ける手はある
**テキストの結合
このページに添付した &ref(textMerge.bat) を使う例で説明すると
青空文庫textだけのフォルダを作り
&ref(textMerge.bat)をフォルダに置いて、そこに 青空文庫textのフォルダをD&D
textMerge.bat のフォルダに text.txt と title.txtが出来る
text.txtの頭に
タイトル
空行
作者名
を入れる
青空文庫を解凍した時に出来る画像ファイルを同じフォルダに入れる
**タグの修正
AozoraEpub3が認識出来るようにしましょう
-ゴシック体 -> 太字 に置換します(その内EPub3が対応するかもしれないので気にならないならそのまま)
-1行だけ指定のタグの一部
--これは正規文字列置換が出来るエディタを使う必要があります(例:K2Editor等)
例:
検索語=>[#改行天付き、折り返して1字下げ]\n(.*)\n
置換語=>[#ここから改行天付き、折り返して1字下げ]\n\1\n[#ここで字下げ終わり]\n
-2重「「・・・」」は現時点では対応してないようなのでAozoraEpub3の対応を待つか置換してしまいます
-タグ中に( )があると画像ファイル名と誤認識--これは一度通してから対応した方が早い
**表紙の作成
画像ファイルが入っていると自動的にソレが表紙になってしまうので
1つでも画像ファイルがあるテキストは表紙を作ってやりませよう
表紙.jpgのようなファイル名にし text.txt に
[#表紙(表紙.jpg)]
というタグをタイトル類の後に入れます
**AozoraEpub3で変換
-1 AozoraEpub3を用意> http://www18.atwiki.jp/hmdev/pages/21.html
-2 AozoraEpub3を起動(起動しないならJAVAをインストール) ダメなら
cd /d %~dp0
start /MIN java -jar AozoraEpub3.jar "%1"
という内容のbatをAozoraEpub3のフォルダに作ってそのバッチを起動
-3 結合textを起動したAozoraEpub3にD&D
-4 エラーや警告が出たら 結合textを修正
-5 出来たepub3のファイル拡張子に.zip を追加
-6 圧縮解凍ツールで そのzip を確認し 500kbyte以上のshtmlファイルが出来ていれば結合textに[#改ページ]を適時追加して分割させなおせよう
-7 変換に利用した結合textと画像ファイルをこのzipに入れておきましょう
-8 zipの拡張子を取ります
**epubファイルに元textを入れておく理由
-元ファイルを一緒に入れておけば問題があっても誰でも対応出来ます
-AozoraEpub3は頻繁に改善されています。 今問題があってもAozraEpub3が対応したらepub拡張子を.zipにしてAozoraEpub3に通すだけで改善されるかも
*textMerge.batの中身
このwikiのバッチやスクリプトは誰でも置換えられるので、ダウンロードしたら実行する前に中身を確認しましょう
cd /d %~dp0
cd
if %1 == / goto :SUB
pause このBATファイルと同じフォルダに text.txtとtitle.txtを作ります
:BASE
del text.txt
del title.txt
for %%I in (%1\*.txt) do textMerge.bat / "%%I" %%~nI
goto :EXIT
:SUB
echo;[#改ページ]>>text.txt
echo;■%3%4%5%6 >>text.txt
echo;■%3%4%5%6>>title.txt
type %2 >>text.txt
echo;>>text.txt
:EXIT