屋根裏通信

在宅で細々実務翻訳をやってます。翻訳、英語の勉強、その時々の出来事などのんびり綴っています。

私の場合、納品はWordベタ打ち原稿が多いので、
PDF原稿をWord読み取ってWordに変換してくれるソフトウェアはありがたい。
イマドキ紙原稿メインで仕事をしているけれど、
英名称や数字の転記はできればコピペで済ましたい。

ということで、これまでは「読取革命」を使用してきました。
http://www.panasonic.com/jp/company/pstc/products/yomikaku.html

「読取」君は、日本語原稿の読取りではまずまずいい仕事をしてくれるのですが、英語原稿の読取り精度にはバラツキがあるような気がします。特に、検索ができないPDF原稿(画像形式と言うんでしょうか)の表の読取りにはかなり難があって、「読取」君がパニックに陥ったことが分かる、文字化けバリバリの結果を返してくれたりします。
でも、私の仕事は和訳なので、英語原稿はさくさく読み取ってWord変換してほしいのね。

では、英語(+ヨーロッパ語)系のソフトウェアならどうなのか。
ということで少し調べてみた結果、OmniPage StandardとFineReaderという2種類のソフトウェア(有料)に辿り着きました。

OmniPage Standardのウエブサイト(英語)
http://www.nuance.com/for-business/by-product/omnipage/standard/index.htm
OmniPageはAmazonさん(日本)でも購入することができます。
http://www.amazon.co.jp/Nuance-Communications-Inc-OmniPage-English/dp/B0077I6278

Abbyy FineReaderのウエブサイト(英語)
http://www.abbyy.com/finereader/
日本に代理店があります。
http://finereader.add-soft.jp/
サポートは付きませんがソースネクストで安売りされることもある
(期間限定)という情報もあります(過去にVer.11は確認、12は未確認)
http://www.sourcenext.com/eshop/

料金的なことを考えれば、AmazonでOmniPageを購入する方がよさそうですが、英語版サイトも含めトライアルができないようです。FineReader(代理店経由)は日本語版ですし、日本代理店のウエブサイトから30日間試用版(100頁まで、1回の保存頁数は3頁)をDLすることができます。
というわけで、FineReader試用版をDLして確認した結果、正式購入に至りました。

インターフェイスは読取革命と似ていて使い易いですが、確認した限りではOmniPageのインターフェイスも大体同じなので、FineReaderは日本語版であるということを別にすれば、使用感については大差ないのかなと思います。
ただ、FineReaderは1台しかDLできません(2台で使用したい場合は2台分購入する必要あり、OmniPageについては未確認)。

試用期間中、少し時間があったので、過去に使用した原稿を使って、読取君とFineReaderの仕事ぶりを比較してみました。

* 画像形式(英語原稿)
画像が鮮明であれば、テキスト部分の読取り精度はあまり変わらないようです。FineReaderの方がやや精度が高い感じ。ただし、表部分(かなり細かい表)の読取り精度はFineReaderの方が格段によく・・・というか、本原稿に関しては、読取君の表は、ほぼ文字化け状態になりました。

* 画像形式(FAXされた原稿を画像化)
元原稿が不鮮明なものだったので、かなり置換ミスはありましたが、FineReaderには「とにかく全部読み取ってやろう」という強い意志(?)が感じられましたが(<ホンマか)、読取君ではかなりの虫食いが生じました。日本語原稿でしたので、これはちょっと意外な結果でした。

* 表題&抄録部分が英語の日本語論文
テキスト部分はFineReaderもかなりの精度で読み取りましたが、修正後でも図表部分の崩れが結構あり、読取君の方が、レイアウトも含めかなり高精度で読み取ってくれる印象です。

* 英語論文(文書PDF、画像PDF各1)
比較した2報については、FineReaderの方が、格段に読取り精度が高かったです(微妙な範囲修正と置換後の多少の文字修正は必要)。ただし、画像PDFでは、図や記号混じりの部分でレイアウト崩れや文字化けが生じました。うんむー、まあ許すか。


必要か不要かは個人の判断になると思いますが、私の場合は、今後は、原稿によって「読取革命」とFineReaderを使い分けていく形になるかなと思います。
2015.05.23 12:44 | 翻訳 | トラックバック(-) | コメント(4) |

ちょりーたさん、まいどです~。
おお、そうなんですね! 論文和訳等では参考文献の翻訳は不要ですけど、英語以外の名前もさくっと読み取ってくれるのは感動です。

2015.05.26 12:17 URL | Sayo@屋根裏 #- [ 編集 ]

同じくFineReader愛用者。スペイン語も普通に読み取ってくれますので。

2015.05.26 09:44 URL | ちょりーた #- [ 編集 ]

Connyさん、まいどです~。
ConnyさんもFineReaderをお使いなのですね(しかも無料・・・)。

FineReaderも決して完璧ではありませんが(多分私が使いこなせていないというのもあるのでしょうが)、かなり精度の低い原稿でも、著者氏名のウムラウトなどもほぼほぼ正確に読み取ってくれるのがありがたいです。

私は翻訳支援ソフトは使っていないのですが、今後何らかの形で導入することになると、Connyさんの仰るとおり精度の高いOCRは必須ですので、まずはOCRソフトを導入してみました。とりあえずは、コピペや調べ物に結構重宝しています。

2015.05.24 16:12 URL | Sayo@屋根裏 #- [ 編集 ]

こんにちは。
翻訳支援ソフトを使い始めてOCRは必需品となり、当初はe.Typist(トライアル+購入)を使っていました。

e.Typistは読取りはまず満足できる質だったのですが、改行マークがやたらと入るためソフトで使えるようにするための文章の補正が大変でした。

数年後アがFineReaderのモニターを募集していたので応募しレポートを提出したところ合格し無料でいただきました♪

満足度はSayoさんとほぼ同じです。少なくともeよりは手間がかかりません。どのOCRでもそうですが、数字と学術系文字(アルファとか)は再チェックが必要ですけど。ドイツ語もしっかり読み取ってくれるし重宝してます。

2015.05.24 14:21 URL | Conny #a4Z/FfFc [ 編集 ]













管理者にだけ表示