屋根裏通信

在宅で細々実務翻訳をやってます。翻訳、英語の勉強、その時々の出来事などのんびり綴っています。

単にThe Ice 2017というアイスショーを観に行った、てだけなんですけど。
で、翻訳には全然関係ない話なので、恒例の「お好みでスルー」でお願いします。

炎天下、グッズ&パンフレット販売と入場のための列に延々並びましたよ。あ、トイレの列もね(年取るとトイレが近いのでね)。
The Iceは浅田真央さん引退後の初アイスショーということで、今年は例年以上の人気だったようです。ワタクシたちも、3人で先行抽選玉砕を繰り返した上でのスタンド席GETでした。
今は国内のショーや試合のチケットはなかなか手に入らないみたいですね。時代は変わったもんだ(しみじみ)。

アイスショーは、14年ぶりです。
(上)では、軽く、過去の数少ないアイスショーと試合の体験を振り返っておきます。

初めての生観戦は第3回NHK杯(in 神戸)。五十嵐文男さんが2連覇された年です。
男子フリーとエキジビションを観戦しました(当時のNHK杯最終日はそういう構成だった)。
35年も前の話なので、記憶もあやふやですが、ジャンプの着氷の音がスゴかったことは鮮明に覚えています。
エキジビションのトリは男子優勝の五十嵐さんで、アンコール曲が終わっても何度もアンコールに応えてくださって、最後は、もう音楽がない中、ステップやバレエジャンプを披露してくださいました。
また、「有望ちびっ子スケーター枠(?)」で、まだ小学生の伊藤みどりさんが参加していて、ジャンプを決めるたびに「やったー」と叫びながら滑っていたのも懐かしい思い出です。

日本で試合(やショー)を見たのはそれが最後で、あとは米国でのショー体験になります。
アメリカに住んでいたのは、米国でフィギュアスケートが大きな盛上がりを見せていた2000年前後。シーズン中は、毎週のようにTVで試合やアイスショーが放映されるという、ワタクシにとってはまさに夢のような環境でした。ワタクシの英語力はフィギュアスケートによって(偏りをもって)培われたといっても過言ではありません。

当時、米国では、全米各地を巡る大きなショーが2つありました。11月末のレイクプラシッドでのお披露目公演(?)を皮切りに、主に2~3月に行われるStars on Ice(当時はプロスケーターのみ)と、4~6月に全米各地を巡るプロアマ混合のChampions on Iceです。前者はプロアマ参加型として現在も継続されていますが、後者は主催会社が経営破綻したり人気が低迷するなどして、2007年に打ち切りになりました(まあ、ワタクシが観ていた当時も、どちらもSold Outはなかったですが)。
あくまで個人的な好みですが、オープニングとフィナーレ以外は各人がそれぞれのプログラムを滑るというスタイルのChampions on Iceより、グループナンバーの多いStars on Iceの方が好きでした。

Champions on Iceは、プロはその年のショー用の演目、アマはエキジビション用の演目を滑るというスタイルでしたが、特にプロには一般受けするコミカルなものが望まれたようで、その昔「氷上の貴公子」と呼ばれたペトレンコが毎年コミカルなナンバーを披露するのを観るのは、ちょっと悲しいものがありました。まあ、案外、本人は楽しんでやっていたのかもしれませんけど。
プルシェンコは当時はまだ20歳前後でしたが、ある年は「Sex Bom」のようなキワもの(?)を披露したかと思うと、ソルトレーク五輪の年はFP「カルメン」を4回転ジャンプだけ抜いてきっちり踊りきるなど、当時から観客を掴む術に長け、振り幅の広さも圧倒的でした。
当時はミシェル・クワンの人気が絶大で、他のスケーターは「Olympic Bronze Medalist and Two-time World Champion」「Three time National Medalist」(テキトーに作ってみたもので、特定の誰かを指している訳ではありません)みたいな枕詞とともに紹介されるのですが、クワンはいつも「America's own」と紹介されていました。それだけ米国民としてクワンという選手が誇らしかったのでしょう。今回、浅田真央さんが「One and Only」(だったと思う)と紹介されていて、その表現が最適かどうかということは置いておいて、当時のクワンとちょっと似ているなあと思いました。

Stars on Iceは、もちろん振付師さんはいるんですが「スケーター皆で作り上げています」感が強く、現役スケーターの中には、引退したら「Stars on Ice」に就職(?)したいと考えている方も多かったようです。ソルトレーク五輪終了後に引退を表明したエルドリッジは、その足で(というのは言葉のアヤですが)「Stars on Ice」に合流しています。
Stars on Iceでは、創設者だからということもあるのでしょうが、スコット・ハミルトンの人気が絶大で、当時でもスケーターとしてはかなり年配でしたし闘病中でもありましたから、毎年全公演に参加という訳にはいきませんでしたが、ツアー参加時は、コールされただけでスタオベという、ちょっと異常な状態でした。
佐藤有香さんも参加されていて、よく「バターナイフでバターを塗るような」と評されるスケーティングをStars on Iceで初めて見ました。

あれから14年。
満員の大阪市立体育館を見渡しながら、この比じゃないくらいデカい(らしい)さいたまスーパーアリーナも満員になるんやな、としみじみしたのでした。
関連記事
2017.08.02 13:51 | フィギュアスケート(14-15 season~)  | トラックバック(-) | コメント(0) |
ご無沙汰しました。
ブログを書きたくてたまらないワタクシには苦行の3週間でした。

31日の丑三つ時に納品を済ませ、仮眠ののち、1日遊び呆け、そちらに心を置いてきました。
よって、このブログはSayobotが書いています。
(「心を置いてきた」イベントについては次の記事で)


ひと月に渡る案件は、量的なことを言えば「できなくはない量」、馴染みのある医療機器で、そこそこ馴染みのある文書。あまり無理せずできると思いました。
(内容的にも訳出作業的にも「やってよかった」と思える案件でしたが、最後の方は訳語や文の吟味にかける時間が、最初の頃より若干お座なりになってしまったのが悔しいです)

しかし、落とし穴がありました(世の中というのはそんなもんです)。

一つは、文書中の統計に関する記述。そもそも、普段から基本のキくらいしか分からない状態で戦っている生物統計ですが、今回は「君の言いたいことが分からないよ」状態でした。てことで、もう一度体系的におさらいせねばなるまいと、ざっと流し読みして放置していた「今日から使える医療統計」(新谷歩、医学書院)を引っ張り出してきたところです。

もう一つは、自分の訳出速度が遅くなっているということ(正確には、遅くなったまま回復できていないと言うか...)。
決して加齢とそれに伴う集中力の低下「だけ」が理由ではありません(それも大きいけど)。
以前は、参考資料や信憑性のあるサイトの表現を機械的に採用している部分がありましたが、しばらく前から「その表現は分野では穏当だが、広く日本語としてどうなのだろう」というようなことが気になるようになりました。資料やサイトとの整合性の問題もありますから、最終的にはよほど「そのままではマズかろう」という場合以外は、そちらの語句や表現を採用するのですが、その前に調べて確認する分、余分な時間が掛かるようになりました。項目全体を通した「読みやすさ(少ない労力で内容が頭に入るかどうか)」も以前より気になります。

てことで、ここ2~3ヵ月、月単位の処理量は同じながら、作業時間的にも精神的にもかなりキツい状態が続いていました。
同様の仕事が9月中旬頃まで続く予定ですが、8月前半はお盆もありますので、思い切って少し長めの納期を申請し、OKを頂いたところです。そもそも、「暑い」というだけでヤル気は失せますし。

とはいえ、それでは、ひと息つけても根本解決にはならないのも確かです。
では、どうするのがいいのかなあと考えてみて、やはり「仕事以外の文章を読む」時間をもっと取らなければならないという(取りあえずの)結論に達しました。

「どうやって力をつければいいのか」という質問に対して「習うより慣れろ」「仕事で量をこなせ」という回答をよく見かけます。ワタクシも、決してそれに異を唱えるものではありません。常日頃からある程度の量をこなしていないと、どんな案件にも一定品質で対応することは難しいですし、分野のきちんとした文章を数多く読んでこそすぐに「正しい分野用語」が口をついて出るようになるのだと思います。でも、それでは、どんなに多読多聴しても、その分野内でしか翻訳能力を伸ばしていけないのではないか。この先を考えたとき、それだけでは寂しいなあと思ったりするわけです。あくまで自分の場合ですが。

ですから、新聞も広告も文学も評論も、もう少し「きちんと読む」時間を作ろうと思います。
毎日のだらけた生活を思い返してみれば、「ダラダラ仕事をする」の一箇所をぎゅっと締めれば、そうした時間がもう少し取れそうです。


読み返してみればですね、
FBでは「7月以降は、もう少し『仕事以外のものを読み書く』時間を増やしたい」と書きましたし、1つ前の「最適の訳語を選ぶ」でも、「次は語彙の拡充が自分の課題。これまでのように『ストーリーを追う』読み方も(それはそれで息抜きになるので)継続するが、文書/書籍によっては表現やコロケーションに注意し、その場で辞書を引き、ときには書きとめる、ということをもう少し意識していきたいと思う」と書いてますが、最後にどちらも「希望的観測」って逃げてるし。仕事しかしない7月を予想しとったな<自分。

というわけで、ちょうど月も変わったところですし、8月、逃げずに頑張ってみようと思います。
関連記事
2017.08.01 15:19 | 翻訳 | トラックバック(-) | コメント(0) |
今日の覚書き。
ちょっと真面目文章風に頑張ってみる。


「やさしい単語の方がジツは翻訳は難しいんだよね」
という台詞を、これまでに何回耳にし、自分でも何度したり顔で口にしてきたことだろう。

それなのに、つい2~3年前まで、私はその「難しさ」を本当には理解していなかったような気がする。今でもきちんと理解できているかどうかはアヤしいが、少なくとも、「やさしい単語の最適の訳語」に辿り着くまで七転八倒することが増えた、と思う。それだけでもなにがしかの進歩には違いない(と自分を慰めて...もとい、奮い立たせている)。

つい先日は one of the most (複数形)... に苦しんだ。次に苦しまずに済むようにと、further, most common, excellentなど、翻訳に苦しんだ単語やフレーズは、My辞書にMy訳語を追加するようにしているが、(あたりまえと言えばあたりまえだが)文脈が異なれば使い回しがきかないことも多い。 one of the most は訳語欄に「~級、~クラス、重鎮のひとり、most challenging (最)高難度の部類に属する」と記入しているが、今回はどれもしっくりこない。
愛用の「対訳君Accept」の対訳データは、ICHや薬局方の対訳も含めて、多くが「最も...なもののひとつ」という訳語を採用している。「最も...な」で複数形が連想できない場合もないではないが、「one of the most ...=最も...なもののひとつ」と機械的に当てはめた場合が多いような感じだ。
「最も...なもののひとつ」それ自体がダメということではなく、「読者が一読したときに、苦労せず『複数の過剰・過多・良質なもののひとつ』という意味が読み取れるかどうか」が重要なのだと、今はそんな風に思っている。その結果が「最も...なもののひとつ」であれば、それはその箇所では最適の訳語としてアリということになる。

Address the limitsも、最近意識の片隅に引っ掛かったフレーズのひとつ。addressは「対処する」と訳すと上手くいくことが多いので、いつもあまり深く考えずにこの訳語を使用してきたが、ふと「限界に対処するってどういうこと?」という疑問が頭に浮かぶという罠にはまってしまい、「打破する」に辿り着くまで結構な時間を要した(ついでに言うと、掃除機をかけている最中に辿り着いた)。

そうした経験を重ねていると、自分はまだまだ語彙が貧弱だという事実を再認識して愕然とする。
今はともかく、若い頃はとにかく本を読みあさった時期があるからだ。いや、だからこそ、自分の語彙力を過信し、語彙の引出しを増やし言葉へのアンテナの精度を高める努力を怠った結果が「今」なのかもしれない。


翻訳とは、「頭の中に原文が意味する『下絵』を描き、それに『作成者の意図』という若干の色をつけたものを思い描き、それを訳文に再現する」という作業だと思う(というのは、これまでに聞いたり読んだりした諸先輩方の言葉を自分なりにまとめたもので、決してひとりでここまで辿り着けたわけではない>念のため<最後まで真面目に行こうと思ったけれど、「屋根裏的不等号」やらずにいられない<屋根裏管理人のサガです、許されよ)。原文と訳文で同じ色合いになるのが理想だが、訳文の目的や性質を考えたとき、(そちらの方がベストであれば)ごくわずかな色調の変化を許容するということも、場合によってはありかもしれない。今の仕事ではまずなさそうだけど。

この頃では、絵を思い浮かべながら「この訳文は適切か、自分の好みや恣意や心地よさを優先して原文のニュアンスまで変えてしまっていないか」ということをよく考えるようになった。翻訳に時間はかかるが、そこは「最適の訳語を選ぶ」上での進歩だと思う(と自分を慰めて...もとい、奮い立たせている)。

問題は、上にも書いたように、語彙のプールが圧倒的に貧弱ということだ。
「原文の語順を変えても、等意を保ちながら言い換えができる」ということについては、この頃、多少はバラして再組立てすることが苦ではなくなってきた(>あくまで「屋根裏」比)。
なので、次は語彙の拡充が自分の課題。これまでのように「ストーリーを追う」読み方も(それはそれで息抜きになるので)継続するが、文書/書籍によっては表現やコロケーションに注意し、その場で辞書を引き、ときには書きとめる、ということをもう少し意識していきたいと思う。当面(半年程度)の目標。
関連記事
2017.07.12 14:08 | 翻訳 | トラックバック(-) | コメント(2) |
「人工知能とニューラル機械翻訳の現状と未来 」(パネルディスカッション)
登壇者(再掲):F田(NICT)、Bor(視聴覚素材のMTの研究)、K木(MTを使用している翻訳会社の代表)、I坂(ノンフィクション翻訳家)、Y田(大学教授・翻訳者、通翻ジャーナル夏号にも寄稿)、I塚(大学教授・通訳者)
略語:MT=機械翻訳、PE=ポストエディット、Pre-E=プレエディット


モデレータから各人に質問
Q. AI、NNW(ニューラルネットワーク)、ディープラーニングなどの用語について、簡単に説明してほしい(F田氏へ)
A. AIには「強いAI」「弱いAI」の2種類がある。強いAIは汎用型AIで何でもできる。弱いAIは定義された範囲で特に単一タスクに力を発揮する。弱いAIの中にNNWがあり、これは機械学習の一種である。ディープラーニングはNNWの一種で、NNWの層が多層になったものをいう。

Q. 放送データ(特にニュースの字幕)の自動翻訳を多言語で出力する研究をされていると伺ったが、現状どの程度まで応用が進んでいるか、また将来は(Bor氏へ)
A. リアルタイムで字幕を3ヵ国語に翻訳している。音声より字幕が遅れて入る点、画面途中で切れる点などが課題。精度はSo-So。東京オリンピックを視野に入れて研究を進めている。

Q. 会社としてハイブリッド翻訳を提供しているとのことだが、どう利用していて、効率はどうか。社員の反応は(K木氏へ)
A. クラウド翻訳、機械翻訳、PEなどを組み合わせ、パッケージ化して提供している。MTはGoogle翻訳を使用。守秘義務等の問題があるので、顧客が了承した場合のみ使用している。20~30%生産性が向上した。特に拒否反応を示す社員もいない。

Q4. 出版翻訳分野ではMTは活用されているか。また今後はどうか(I坂氏へ)
A4. 書籍はノンフィクションの翻訳。その他に雑誌や新聞記事の翻訳もしている。MTを試してみたことはあるが、成功したことはない。論文でも試してみたが、自分でやった方が早いということが分かった。MTではないが、訳抜けや数字ミスを防止する目的で、翻訳を終了したあとでFelixのアラインアシスト機能を使用することはある。出版翻訳業界では、数年前のTランダムハウス”アインシュタイン事件”(出版翻訳にMT翻訳が使用されたことが分かり書籍が回収された)以来、MT翻訳には特に慎重になっているような印象がある。個人的には、英語以外の資料の大意を知りたいときなど、Google翻訳を使用することはある。

Q. 通訳の現場での自動翻訳に対する意識は(I塚氏へ)
A. 特に機械を使用するという空気はない。特に、コミュニティ通訳やビジネス通訳など、やり取りが行われる現場での通訳では、「単なる変換に終わらない」という点も(コアではないが)通訳に期待されている部分のひとつであると思う。通訳の分野では「自動通訳」の開発は、旅行、ホテル、病院など、短い明確な目的を持ったものを対象に始まった。そうした「ちょっとした」プロの通訳を使用できないようなシーンにおけるMTは十分実用的で、新たな需要や分野が創出される可能性はあると思う。

Q. 通訳翻訳教育の現状を(Y田氏へ)
A. 専門職者の教育は大学院レベルではあるが、4~5年前ほど流行っていない印象。現在は、語学を学ばせるために通訳訓練法を取り入れるなどの形で通訳翻訳を教育に取り入れるのがトレンドのひとつとなっている。また、一般教養でリテラシー能力を上げようという動きも出てきている(工学部の学生を対象に、将来英語を使うことを視野に入れた実用的な英語教育を行うなど)。教育へのテクノロジーの組込みは、現時点ではまだないのでは。


Q. NMTはSMTより人間ぽいのか。
A. NMTは、画像的なものから言葉が出てくるイメージなので、人間ぽくはないと思う(F田氏---ここで、一時、パネリストが同時に喋り出すという、収拾のつかない状態に。特にI塚氏、I坂氏からは「それこそが人間的な翻訳では」という意見が出ました。F田氏からは、「人間ぽいと言えるのかもしれないが、現時点では、人間と同等の最適化はできていないような気がする」とのコメントがありました)。
 * (Sayoの補足)F田氏は、研究者として、(決して単語レベルの対応という意味ではないものの)翻訳を文字から文字への変換として捉えておられて、それに対して「NMTはもう少し異なる翻訳の仕方をします」という意味で「画像的」という言葉を用いられたのだと思います。

Q. 人間は五感を使って翻訳していると思うが、MTにもそれは可能か。
A. NMTでは可能だが、インプットを行うのは人間。データの形でそうしたインプットが可能になれば可能(F田氏)

Q. MTの限界は。
A. どこに限界を設定するかの問題で、実質的に限界はない。人間は、自分たちができないものを代わりにやってくれることをAIに求めており、決してAIが人間を超えることを求めているわけではないと思う(F田氏)。

Q. 通訳翻訳の形は変わっていくだろうか。今後、通訳者・翻訳者には何が求められると思うか。新たな翻訳の形(たとえばPEなど)の教育機会はあるのか。
A. PEのマニュアル的なものはない。PEを嫌がる翻訳者も多いが、ツールの1つとして考え、共存する道を探りながらキャリアプランを考えた方が選択肢が広がると思う(K木氏)。
  テクノロジーの進歩が早く教育として固める時間がないのが現状。PEについては、「翻訳」側というより、「校正・修正」側からのスキルが求められるような気がする(Y田氏)。
  通訳や翻訳に関する認識は、学生(翻訳=文芸翻訳)、大学(英語能力の向上に翻訳を使用したい)など、関連する者の立場によって異なる。今後「プロ養成教育」もあり得るかもしれない(が現時点では...ということだと思いますby Sayo、発言はI塚氏)。
  そもそも、新しい技術が現われたときにそれを捕捉し取り入れていく方法(=メタ学習能力)を教えることが必要なのでは。そのためには産官学の連携が必要だが、こうした考え方が三者で共有されていないのが現状(F田氏)。

Q. AIに敗れたチェス・チャンピオンは、「自分が(AIに)負けても人類は絶望せず逆に進化した」と言っているが(このとおりの言葉かどうかは不明。確認は取れず。大意は間違っていないと思います by Sayo)、通翻の分野でもMTの発展により人間がさらに進化することは可能か。
A. 人間が思いつかない訳を返してくる可能性はあるので、「こんな訳も可能」ということで翻訳メモリ的に取り入れることは可能かもしれない(Y田氏)。
  AIの発展により脳の働きもさらに解明されていくだろう。それによって人間の認知も向上するということはあると思う(I坂氏)。

(AIの倫理に関するQ&Aがありましたが、Q、Aともにきちんとメモできておらず発言者も不明なため、割愛します)

Q. AIは本来人間の生活を楽にしてくれるもののはずなのに、技術によって仕事を奪われると考えている翻訳者が多いのはなぜだと思うか。
A. 「奪われる」と考えるのは間違い。さまざまな家電が発明されても主婦業そのものはなくならないのと同じ(K木氏)。
  経営者側だけが特をするなど、恩恵が均等に配分されないという気持ちが「仕事を奪われる」という恐怖につながるのでは(モデレータ氏)
  MTを把握できずに(よく知らずに)恐れている、ということもあると思う。どうやってOutreachしていくかが課題(F田氏)

* 全体を書き取ることができず闇に葬った回答もあります。ご容赦ください。


F田氏の視点は、かなり「研究者を超えた」ものであると感じましたが、それでも、翻訳Cafe全体を通じ、「どこまで向上させることができるか」「その能力が翻訳者の日々の仕事をどう変え得るか」という点が議論の中心で、研究者や教育者的視点から物事が捉えられているなという感じを受けました(特に今回だけなのかもしれませんが、「発注者/読者は何を欲しどのように考えるか」という視点があまり感じられませんでした)。

たとえ研究者が満足するレベルに到達しなくても、費用対効果の点でユーザーが「これでいい」と考えれば、今後MTはさらに普及していくのではないでしょうか。「これでいい」レベルが低下すれば、そのレベルに合わせていくという形で翻訳全体のレベルも低下する恐れがないとは言えません。それがユーザーニーズなのだからと言ってしまえばそれまでですが、「これでいい」と考えるユーザーの中には、「本当にいいのか、なぜそれでいいのか」をきちんと考えておられない方も一定数いらっしゃるような気がします。そうしたユーザーに対して、MTの利点と欠点をきちんと説明していく(少なくとも説明できるように理論武装する)ということも、翻訳者として心に留めて置かなければならない点かもしれません。
(蛇足ですが、参加者からの質問の中に、「誰でも簡単にGoogle翻訳などのMTの品質を評価できるソフトウェアはあるか、またその開発は進んでいるか」というものがありました。複数種類の誤りがそれぞれどの程度あるかを数値化するようなソフトは、まだ開発できていないようです。この質問に関しては「そもそも数値化する意味はあるのか」「翻訳を知らない人には分かりやすい指標になる可能性がある」と両極の意見が出ました。)

MTが今後どの程度の速度で進化していくのか、今回お話を聞いただけでは私には分かりませんでした。ただ、今後、Pre-Edit+MT+PEをうまく組み合わせることで、「バラツキなく一定レベルの訳文を生成する」ことは可能になると思いました。ですから、「翻訳Cafe(上)」でも書きましたが、(それが翻訳か否かという議論はひとまず置くとして)今後(Pre-Editもできる)PEの需要は伸びていくだろうと思います。そのPEの能力について、「校正・修正」側からのスキルが求められるのではないか、というY田氏の意見はちょっと面白いと思いました。そうした能力を身につけたPost Editorは、もっと評価されてもよいのではないかと思います。

私自身は、やはり自力翻訳をやっていたいなあという気持ちが強いのですが、そのためには、実力を磨き、アンテナを張り(人手の方がreasonableな価格で満足できる仕上がりが得られる分野や文書の種類を見極め、その仕事を取っていく)、提案すべきときは根拠をもって提案できるよう知識を蓄える努力をしていかなければならないと改めて思いました。
よく「内容は正確に、日本語はよみやすく(和訳の場合)」と言いますが、これからは、翻訳をやって生き残っていくためには、どう「正確」で(書かれてあることに加えて、作成者や読者の存在も考慮しているか)、自分の訳文の読みやすさは単なる流暢さとどう違うのかといったことを、きちんと言葉にできる(無意識のうちに常に意識している)ことがさらに重要になってくるような気がしました。

難しい内容でしたが、参加してよかったです。先生にもご挨拶できましたし。
関連記事
2017.07.04 22:16 | 翻訳 | トラックバック(-) | コメント(0) |
土曜日に開催された「翻訳通訳テクノロジー研究プロジェクト特別会合+翻訳Cafe」に参加してきました。
内容や発表者の詳細は、「翻訳Cafe」のHPを参照してください。

個人的には、前半の情報通信研究機構(NICT)さんの発表「機械翻訳を活用するための言語処理技術 」より、後半の「人工知能とニューラル機械翻訳の現状と未来 」というパネルディスカッションが楽しみでした。顔ぶれを見ると、研究者2名+教育者2名+翻訳者(翻訳会社)2名という偏りのない(?)構成です。昨年通信講座でお世話になった先生がパネリストのおひとりで、翻訳者代表としてどのようなお話をされるのかという点にも興味がありました。

今回も一生懸命メモを取ったのですが、馴染みのない内容のせいか、特に第1部はうまくまとめられません(取捨選択すべきポイントがよく分からないというか...)。

ですので、前半に関しては強く心に残った点のみ箇条書きするに留めます。
登壇者は、いつもの「屋根裏」仕様で、F田(NICT)、Bor(視聴覚素材のMT--とお聞きしたような気がするのですが、正確なところは聞き漏らしました。研究業績からも今回のトピックスに関係するような研究はちょっと確認できませんでしたので、間違っているかもしれません)、K木(MTを使用している翻訳会社の代表)、I坂(ノンフィクション翻訳家)、Y田(大学教授・翻訳者、通翻ジャーナル夏号にも寄稿)、I塚(大学教授・通訳者)と記載します。

「機械翻訳を活用するための言語処理技術 」(F田)

・ 2016年11月11日、Google翻訳が統計的MT(以下SMT)からニューラルMT(以下NMT)に変わった。語の分散表現(distribution representation)という方式を用い、多層ニューラルネットワークによる非線形変換を可能にした点が、成功した理由のひとつである(この1文でもう挫折しそうや)。

・ 機械は原文を「理解」しているのか?-「理解」をどう定義するかによる。訓練データの範囲内での最適化の結果が訳文であり、「最適結果を生成する=理解」と定義するならば理解していると言うことができる。

・ MTの今後-どんな情報でも、それを形式化して入力することができれば利用可能。テキスト周りでは前後の文脈などがこれにあたり、テキストの外界では、著者の特性、対象とする読者などがこれにあたる。これらを利用できるようになれば、MTの精度はもっと向上するだろう。

・ MTを活用する上での課題は高速化と高精度化。一般に対訳コーパスが大きいほど高性能となる。対訳コーパスの拡充が必要。未知語への対応(既知語での言換え)、複合語の分割なども必要。

・ MT実用上の最大の課題は品質のばらつき(現時点)である。一定の品質保証を前提とした翻訳の戦略は4種類ある:人手による翻訳、機械に支援された人手翻訳、人間に支援されたMT、高品質MT。このうち人間に支援されたMTはMT+PEであるが、MTの前編集としてPre-editing(原文を書き換えてMTしやすくする人手作業)を行うことで、MTの精度は上がると思われる(研究段階---意味の分からない日本語を意味の分かる日本語に変換してから英訳することを「日日英訳」と表現される方がおられますが、それと同じ感じかなと)。

・ MT訳の品質推定(Quality Estimate: QE、どの程度の品質が保証されるか)が必要-使用者の立場での信頼度。語レベルのQEの研究は進んでいるが、文レベルのQEはまだ訓練データが少なく、現在取組み中である。

・ Google翻訳と研究のMT翻訳との違い-Google翻訳はウェブから全自動で収集したものをすべて使用している。研究MTには人手が入っている。

・ (F田さん個人の感想として)研究者は、実際的な翻訳には何が必要かがあまり分かっておらず(関心も薄い?)、文単位でMTの評価を行いがち。その数値を上げることがゴールで、その先については考えていない研究者が多い印象。研究者・教育者・実務者が連携する必要があると痛感。

という断片的な感想を読んでいただければ「ほとんど理解できてへん」ということが分かっていただけると思います(?)。
興味が湧かれた方は、F田さんとY田先生が発表された論文に目を通していただければと。
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D6-1.pdf

NICTの研究は、特にQEの点でまだこれからという印象を受けました(あくまで個人的な印象です)。
とはいえ、Google翻訳を含むMT全体を見れば、「まだまだ大丈夫」と安穏としていられないという感じもします。

将来、MT翻訳は、「Pre-Edit-MT-PE」というセットでどんどん精度を上げていくのではないかと思いました(その「どんどん」のカーブがどの程度急かということについては、ワタクシには何とも言えません)。翻訳とPEは別ものという考え方もありますが(思考過程を考えると、ワタクシ自身もやはり別ものと思います)、実際問題、「翻訳業界のひとつの職種」として今後(Pre-Editもできる)PEの需要は伸びていくだろうという気がします。PEにはPEとしての高い能力が求められるはずで、レベルの高いPEはもう少し評価されてもよいのではという気もします(PEについては、パネルディスカッションの中でも、興味深い発言がありました)。

長くなりましたので、パネルディスカッションの報告と全体的な感想は(下)に譲りたいと思います(ごめんして)。
関連記事
2017.07.03 07:49 | 翻訳 | トラックバック(-) | コメント(3) |