求む!セリフ入力ボランティア その2-20110417

求む!セリフ入力ボランティア その2
 


[修正][削除][Fメール]ID:jeartgr11/04/15 02:36:11
 
BASE NOTE
セリフ入力ボランティアのスレッドが30に達しましたので、『その2』をご用意しました。


 

[修正][削除][Fメール]ID:jeartgr11/04/15 02:44:33
 
APPEND 1
おお、ちゃんとスレッドたってる。
はじめてなのでドキドキ。

本日公開された『みらくる姫ジュビリィ』の作者、宮尾岳先生の絶版作品では、『魔物ハンター妖子』は鉄板として、『七味撫子うのん』も読みたいですね。

今日はセリフ入力まで手が回りませんでした。
すいません。
 


 

Bibliotheca[修正][削除][Fメール]ID:mjifep11/04/15 10:21:18
 
APPEND 2
 「ジュビリィ」を、セリフ入れ(電子書籍の写植?)としてではなくコミックとして楽しむ為にじっくりと読みつつ、特に自分と他の方が入れたセリフを所々見ていました。

 吹き出しの中の写植されたセリフに関してはどなたもテキストに起こしていましたが、所謂描き文字や吹き出しに入っていない地の文(心中の考えなど)に関しては人によりけりという感じでした。
 後、変換ミスなのか、片仮名と平仮名の違いがある箇所もありました。
 一番気に成ったのは、改行位置でしょうか。
 句読点が無く、代わりに空白だったり改行だったりしているのですが、テキストの改行は皆迷ったのか微妙なものもありました。
 テキストの一行を一文と取り、翻訳用のベースと見なすのであれば、機械翻訳では誤訳を招きやすいかなといった感じがする改行の仕方も無きにしも非ずと思いました。

 自分がテキストに起こした分は、後から気付いたならそこで手を入れますが、他の方の作業分は正直気が引けます。
 作品へのコメント欄がありますが、入力したテキストについて他の作業者と意見を交換する為のコメント機能が欲しいかなといった感じです。
 Wikipediaで言うNoteになるでしょうか?
 入力した方に確認して欲しいとか、そんな事を伝える為の機能です。
 自分勝手に編集すると齟齬を来しそうなので、それを回避する為のと言う気持ちですが、如何でしょうか?


 後書きや付録の手書きまでテキストに起こしてあるのは、大変だったろうと思いました。
 個人的には、カバーの返しにでもあったのか、奥付がなかったのが資料性からはちょっと残念でした。

 『プレイヤーは眠れない』は未参加なので判りませんが、今回は正に競争でした。
 次に起こそうと最初に開いたところは誰かが作業中でロックしてあり、次に向かうという事たびたび。
 ページ数にして2桁行ったかと言うところだったでしょうか?
 チャットで慣れているとか、取材テープからの起こしで慣れているとか、そのような強者が幾人も居たのではないでしょうか?
 頼もしい限りですね。
 皆さんご苦労様でした。


 

xi[修正][削除][Fメール]ID:yubqvm11/04/15 13:03:32
 
APPEND 3
Michinori Goto(MITI)

ChromeでW入力症状がでると言うので他のブラウザも入れてみました。
元から入ってるIE(遅いので嫌い)
FF
ルナスケ
オペラ
皆さんどのブラウザで入力が一番スムーズでしょうか?


 

[修正][削除][Fメール]ID:jeartgr11/04/15 15:08:54
 
APPEND 4
xiさん
私は低スペックPCなので、Chrome一択です。


 

KenAkamatsu[修正][削除][Fメール][URL]ID:hdtdq11/04/15 15:46:32
 
APPEND 5
すみません。せっかくセリフを入れてもらったのに、「みらくる姫ジュビリィ」は
一旦配信停止です。m(_ _)m 申し訳ない。
早めの復活のため、鋭意努力中です。

ポツポツと、ラブひなのセリフ入力でもしていこう・・・。orz
どなたか、お供よろしく。
 


 

xi[修正][削除][Fメール]ID:yubqvm11/04/15 15:59:23
 
APPEND 6
はい。
ちょっと他のブラウザでも試してみたいので、
今窓の杜で色々なブラウザDLしている所です。
ブラウザ入れなおしたら、
「らぶひな」やらせていただきます。


 

nagog[修正][削除][Fメール]ID:pqaxr11/04/15 19:45:30
 
APPEND 7
Bibliothecaさん

お疲れ様です。
今回、あとがき他本編のセリフ入れを行いました。

いや、ご指摘のとおり、どうしようかすごく悩みました。

「。」のあとに空白で書かれていたり。
(ページの都合上、作者のほうでは改行していない)
同調(シンクロ)って一般的な読み仮名でないルビが振ってあったり。
マルDをどうに書こうか考えたり。
英数を半角にするか全角にするか考えたり。
文字つぶれてて読めないのを作品名だから推測で書いたり。(熱風のカザン)
最後の署名でさえ、苗字と名前の間に空白あるのか悩んだり。

本編ではフキダシ外のセリフを入れるかどうか迷ったり。
それを入れたら擬音はどうしようか考えたり。(これは入れませんでした)
ハートマークが出てきたり。(ブラウザ依存?)

機械翻訳をベースに考えると、確かに改行などは原文に沿ったままでないほうが
良いのかもしれませんね。
ただ、「。」の後の空白ならば区切るだろうと思ってそのまま書きました(^^;)

参考までに今回の一部を機械翻訳(Google)したところ、気になる点が。
ヒロインは「He」です。また、雑誌名でマンガBOYSなどは分割されます。

前にも出てますが書き方の目安などがあると悩まずに入力できるし、統一感が出るので良いと思いますが、どのように行いましょうかね?


 

[修正][削除][Fメール]ID:jeartgr11/04/15 23:06:17
 
APPEND 8
ラブひなが活字化されていないのが意外でした。
後ろの巻はほぼ未着手ですね。
最終巻を少しやります。


 

Moonlithill[修正][削除][Fメール]ID:ffvayp11/04/16 00:56:59
 
APPEND 9
赤松先生、現在ラブひなのセリフ入力をしているのですが、
①部屋の名前や文字が書かれた物が出てくる際、どのように入力すれば良いか
 (可奈子がチェック表を塗るシーンなども)
②擬音や効果音をどの場所に入力するか(セリフの間など)
という店に躓いております。

コメントに、「先生の判断にお任せします」等残していますが、不適切であれば、変更をお願いします。もしくは、何かルールができればそれに沿って作業を進めたいと思います。
 


 

桃やん[修正][削除][Fメール]ID:xeuhb11/04/16 00:57:50
 
APPEND 10
入力中に拡大鏡を使い、見ながらセリフ入力していて、
間違えてページをクリックしてしまい、1ページの拡大表示に移動してしまい、
文章が全て吹っ飛ぶというのを経験しました。

ものによってはこれ、1話で2時間ぐらいかかりますね。。。

>>Moonlithillさん
ぶっちゃけ、現在はそこまで細かく求めていません。
まだ模索中の段階ですので、そう構えずに自分にとって「これが俺のJustice!」みたいな感じで入力してって問題ないですよ~


 

KenAkamatsu[修正][削除][Fメール][URL]ID:hdtdq11/04/16 12:38:28
 
APPEND 11
>Moonlithillさん

う~ん・・・「図」関連は、入力しなくてもいい気がします。
擬音も、一応「必要無し」な気が。


ところで実は、「自分は『ラブひな』の○巻を入力した!」みたいな宣言があると、
評価が楽だったり。(^^;)(ウソだったらすぐ分かるので)

山の頂上に旗を立てるみたいな。
 


 

かんべえ[修正][削除][Fメール]ID:icfnhtf11/04/16 13:48:54
 
APPEND 12
ラブひな9巻のテキスト入力中、
「成瀬川」を「ダル瀬川」とタイプミス。

札幌ドームのマウンドに仁王立ちしている映像を
思い浮かべてしまい腹筋崩壊。


 

えめす[修正][削除][Fメール]ID:hiclco11/04/16 14:13:22
 
APPEND 13
何処を入力する・入力したを宣言するとどうなるか、少し興味がわいてきました。
ということで…
ベルモンド2巻は42ページ以降。
ベルモンド3巻は39ページ以降。
ウェカピポの攻撃を受けた人のために右半分だけ未入力にしておきました。


個人的ペース配分では片ページのみが一番あうようなもので…変な埋め方もうしわけない。
 


 

Bibliotheca[修正][削除][Fメール]ID:mjifep11/04/16 14:13:53
 
APPEND 14
> APPEND 9

 ノベライズではないので、地の文に至るまでの全ての情報を起こす必要はないと思います。

 目的が翻訳と読み上げなので、その線に沿った基準で判断すると良いと思います。
 吹き出しの中の写植された物は原則必要。
 それ以外には、この漫画が外国語で書かれていると思って、どの程度翻訳されていればどんな漫画か判るのかと言った事が目安となるかと思います。
 或いは、この漫画が絵本であると思って幼童に読み聞かせる場合を想像します。
 絵本を見れば判る事は、読み上げる(セリフに起こす)までもありません。
 テンポも悪くなりますし、却ってゴチャゴチャとして内容が分からなくなってしまいます。
 あれもこれもと鯱張らずに、手を抜きたいから最低限必要なモノだけで、位に思って良いと思います。

 それに、自分が起こしたモノに自身が無くても、他のもっと慣れた方が手直し編集してくれるでしょうから自分にできる分だけでも構わないと思いますよ。


追録…

 ラブひなの9巻をちょこちょこセリフ起こしていたのですが…
 以前に入れていた分をチェックしていたら、見る影もなく上書きされていて、プチショック!
 同じ話数で、改行とか装飾がまちまちだと気に入らないとかそんな感じかもしれませんねぇ。
 1話完全に終わらせずに、別件の作業を他でやっていて間が開いていたのも悪いのでしょうが流儀とか合わずに上書き編集合戦していると切りがないので、一旦正しく入っているようなら取り敢えず一般ユーザーは編集不可にしてブッシュアップは特定スタッフのみにするのも有りかもしれません。


追記
> APPEND 14

 最新のモノに上書きのみだと、経緯が不明になりますね…
 システムが煩雑になりますが、作業者を階級分けする手もあります。
 入力作業を頻繁に行っていて、Jコミとして望ましい文書文体書式で記述するなどしている方をより上位にランクします。
 最初はログインユーザーは誰でも編集できますが、ランクが上位の方が編集したモノは同等以上のランクのログインユーザーしか編集できないようにします。
 不慣れな者が良かれと思いつつ、Jコミ的には品質を下げてしまうのを回避する為です。
 より自由度の高い編集を気兼ねなくやりたいと思えば、実績を積み重ねてJコミへの貢献をアピールする必要があります。
 また、ランク上位者の文体や入力状況を参考・手本とし、Jコミとして望ましいセリフ入力方を学ぶ機会をも提供できるかと思います。
 記述法をある程度揃える為にも、習える向きを示しておく方が良いと思います。


 早急に検討すべき点があります。

 最新のデータしか残らないなら、荒らしへの耐性が弱いと言えます。
 例えば、悪意ある業者がせっかくセリフ入れしたところに宣伝コピーを上書きして保存する事も現状では可能ですが、それを回復するには再度入れ直すしか有りません。
 気付いた時点で悪意あるユーザーのアカウントは削除してそのアカウントでの被害拡大は防げますが、異なるアカウントを習得して再度行う事は可能ではないでしょうか?
 現在は良識ある作業者ばかりだと思いますが、将来的にターゲットにされ、注目されているJコミでのプロパガンダは都合良いと目を付けられらときが大変ではないでしょうか?


 比較的弱い検討項目

 セリフ入れは、選択した言語毎に個別にデータを管理してます。
 例えば、翻訳を試すなどしていて英語になっているのに気付かず、英語のセリフ入れなのに空白だからと日本語で入力して保存が可能です。
 日本語以外の所に日本語が入っていても、宜しくはないのでは?
 保存時に文字コードをチェックして、入る筈のない言語が混在していないか判別して、矛盾していそうなら作業者に確認を促す事はできないでしょうか?


 

KenAkamatsu[修正][削除][Fメール][URL]ID:hdtdq11/04/16 14:52:33
 
APPEND 15
>えめすさん

入力がどこまで進んでいるか分かりにくくなるので、できれば両ページ
入れていただけませんか。(^^;)


>Bibliothecaさん

その問題は、必ず出てくると思いました。
Wikipediaは、確か上書きされても、古い記述が残ってるんですよね。
しかしJコミでは「誰が上書きしていったかの歴史」しか残りません。

一度入力されると、その後特定スタッフしか編集できなくなるアイデアも、
ちょっとした誤字や微修正を一般人が全くできなくなる不都合があります。
う~ん・・・・難解だ。orz
 


 

えめす[修正][削除][Fメール]ID:hiclco11/04/16 15:15:31
 
APPEND 16
個人的にはむしろウェルカム校正。

せっかく文字装飾を時間かけて調整しても、通りすがりの悪い人が数クリックで全部消していくことができてしまうのですね。
消されたデータは再度入力しないと元にも戻せない。
しかもそのイタズラの後に誰かがきちんと書き直してしまうと、イタズラの事実と共に犯人が誰なのかも分からなくなってしまう。
wikipediaの仕組みを参考にすればよさそうですが技術的に大変なのかも…。

とりあえずは既存データを修正した後はコメント欄に「こういう理由でこういう風に修正しました。」と編集履歴を残すようにするだけでも多少改善するかも?
コメント欄をnoteとして使ったりですね。
編集者同士のコミュニケーションって大事なような気がします。
 


 

Koke[修正][削除][Fメール]ID:hifpq11/04/16 15:32:38
 
APPEND 17
>>前スレ23
桃やんさん
なるほど。
登録していれば誰でも出来るんですね。
暇なときにやってみようかと思います。
ありがとうございました。


 

えめす[修正][削除][Fメール]ID:hiclco11/04/16 16:37:55
 
APPEND 18
>>KenAkamatsu さん

うーん、そうですか。
とりあえずラブひな 5巻も65ページまで片ページで進めてたんで、右半分も埋めてきました。
むむ、ちょとつらい…。
他の埋めのこしはまた後日。埋まってなかったら埋めてきます。
あ、ベルモンド2巻は15ページ以降だった。
 


 

korekaraha[修正][削除][Fメール]ID:ffvayp11/04/16 17:27:42
 
DELETED
DELETED


 

かんべえ[修正][削除][Fメール]ID:icfnhtf11/04/16 18:05:01
 
APPEND 20
検討済みだろうとは思いますが、

新型アルヌールにセリフ検索機能があるってことは、
何かしらのOCRエンジンを積んでいるのですよね。

公開前にOCRカマして、解析結果をセリフデータに流し込む、
みたいなシステムは難しいでしょうか。

おそらくデタラメな解析結果になると思いますが(^^;
それを元に有志で手直ししていけば、一から手入力するより
手間が省けるかなあ、と思いまして。

 


 

アメムラ[修正][削除][Fメール]ID:bnwvxe11/04/16 18:32:00
 
APPEND 21
>かんべえさん

漫画で何冊か、OCRを試してみたのです。
ソフトは、imageFORMULA 付属の、CaptureOnTouchと、
Adobe Acrobat 9 Pro。

どちらも小説などでは、8~9割くらいの精度です。
どこに何が書いてあるのか、何度も出てくるような
単語で検索するには十分だと思います。

しかし、漫画になると・・・ほぼ壊滅。
どこにモジがあるか、ぜんぜん判別してくれません。
「正しく」読み取れたのが1割いくかいかないか位です。
加えて、絵部分も文字と認識されて、余計なデータ、たっぷりです。

もっと高級なものを使えば、もう少し精度よくなるかも
しれないですが、やはり、手で1から入力したほうがはやそう
な気がします。

OCR的なものを導入するとしたら、活字の範囲をボランティアが
範囲を指定して、トリミングして、それをOCRにかける・・・
もしくは、reCAPTCHAも面白いかもしれないですね!

>reCaptha
http://labs.cybozu.co.jp/blog/akky/archives/2007/05/recaptcha-human-group-ocr.html




 


 

Bibliotheca[修正][削除][Fメール]ID:mjifep11/04/16 18:45:51
 
APPEND 22
> APPEND 9

 ノベライズではないので、地の文に至るまでの全ての情報を起こす必要はないと思います。

 目的が翻訳と読み上げなので、その線に沿った基準で判断すると良いと思います。
 吹き出しの中の写植された物は原則必要。
 それ以外には、この漫画が外国語で書かれていると思って、どの程度翻訳されていればどんな漫画か判るのかと言った事が目安となるかと思います。
 或いは、この漫画が絵本であると思って幼童に読み聞かせる場合を想像します。
 絵本を見れば判る事は、読み上げる(セリフに起こす)までもありません。
 テンポも悪くなりますし、却ってゴチャゴチャとして内容が分からなくなってしまいます。
 あれもこれもと鯱張らずに、手を抜きたいから最低限必要なモノだけで、位に思って良いと思います。

 それに、自分が起こしたモノに自身が無くても、他のもっと慣れた方が手直し編集してくれるでしょうから自分にできる分だけでも構わないと思いますよ。

 


 

Moonlithill[修正][削除][Fメール]ID:ffvayp11/04/16 18:46:02
 
APPEND 23
なぜか他の名前で発言してしまったので、そちらは削除しました。

赤松先生、お返事ありがとうございます。先生のおっしゃるように、擬音等は省いて入力します。
また、現在わたしはラブひな11巻の93話~96話の入力を終えました。


 

かんべえ[修正][削除][Fメール]ID:icfnhtf11/04/16 19:20:07
 
APPEND 24
>アメムラさん

ありがとうございます。
う~ん、やっぱりマンガにOCRは厳しそうですね。
残念。。


いや、でも、手打ちも楽しんでますけどね。
「モトコちゃん」を「モトコたん」とタイプミスして悶えたり。
直すのが惜しい…。


 

ninamo[修正][削除][Fメール]ID:fsoytu11/04/16 20:43:45
 
APPEND 25
フェローじゃなくても書き込んで良いようなので、、、
交通事故鑑定人環倫一郎のセリフ入力をしているのですが
同じ話の中で一休み&ひと休みのように表記にゆれがあります
この場合統一したほうがよいのでしょうか?それとも元のまま?
皆さんはどうされてますか?
今はとりあえず元の表記に従ってます


 

桃やん[修正][削除][Fメール]ID:xeuhb11/04/16 23:15:47
 
APPEND 26
>ninamoさん
とりあえず元のままでいいかと思います。

ラブひなでも
2年生と二年生で表記のゆれがあったりしますし。

現状は同一性を重視して書きこんでいった方がよろしいかと思います。


 

アメムラ[修正][削除][Fメール]ID:bnwvxe11/04/16 23:22:21
 
APPEND 27
どこらへんにセリフ未入力があるか、わからなくて、
手をつけづらかったので、こんなのつくってみました。
Iが未入力で、Aが広告、JがJコミからのメッセージ。.が入力済みです。

http://aods1004.com/jcomi_serifu/list.htm

更新されるのに今のところ4時間くらいかけるので、
すでに入力されているところもたくさんあるかもしれません。

※いまのところ自動更新はされません。

こんな機能が、Jコミ公式にあると、セリフ入力が速くなると思います!
外からこういったデータを取得するのは、
かなり、負荷等に気をつかった作業になって、遅いので。

フェローの階級があがったりすると、こういう編集用の情報に
いけたりして、校正しやすくするってのもいいかもしれないですね!

 


 

R[修正][削除][Fメール]ID:noajj11/04/16 23:36:37
 
APPEND 28
とりあえずベルモンドの3巻は多分終わりました。
全部1ページおきに入ってたようなので隙間を埋めてみました。
# 後ろから埋めて行ったら70ページくらいまでは誰かが埋めているようでしたが

>アメムラさん
どれくらい終わってるのか一目で分かっていいですね。ちゃんとクリックすると飛べるし…

追記:
2巻も全部終わり~。
1巻は終わってるみたいなので、ベルモンドは一通り入りましたかね。


 

えめす[修正][削除][Fメール]ID:hiclco11/04/17 00:19:58
 
APPEND 29
>>アメムラさん(APPEND 27)
これすごい!一目瞭然でしかも未入力ページに飛べる!

>>R
作業再開しようとしたら残り全部埋まっててびっくり。助かりました。

2巻はあしたがんばるかー。
 


 

こたみか(ボランティア)[修正][削除][Fメール]ID:hrjff11/04/17 01:38:37
 
APPEND 30
☆ラブひな14巻
必要なページにリビジョン全部入ってました。
文字校まではやっていません。
とにかく未入力のページに入力していこうと思います。

アメムラさん Jコミ セリフ入力未入力リスト ありがとうございます。
http://aods1004.com/jcomi_serifu/list.htm

どこまで入力されてるのか分からなかったんで
最終巻から順に入力してくかーってやってたとこでした。

リズム良く入力してる時に小さい文字があると
保存して拡大鏡で見て再度入力ってしないといけないので
早く解像度が上がらないかな・・・チラッチラッ


[Jコミ・フェロー会議室]
 

タグ:

+ タグ編集
  • タグ:
最終更新:2011年04月20日 22:03
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。