ここのところ、マイクロソフトのナレッジベース(正しくは「サポート技術情報」。以下、KB)に、はまっています。
KBは、世界中のサポート窓口に寄せられる製品についての質問を元に、それぞれの質問に対する回答を文書にしたデータベースです。特に英語で検索すると、本当にたいていの問題は答えが見つかるという、マイクロソフト製品(の障害)についての巨大な知識データベースです。
日本語だとヒットする件数がぐっと少ないのが難点です。たぶん、もとの情報が英語圏からのものが大多数で、日本語への翻訳が追いつかないためと思われます。その解決策として、最近、英語のKBをそのまま機械翻訳したものも検索結果に入れるというオプションがつきました。ところが、機械翻訳された文章の中に、素っ頓狂な珍訳が混ざっていて、これがなかなか楽しめます。
こんな感じ。

誤解のないように断っておきますが、私は「だからマイクロソフトはダメだ」とかそんなことを言うつもりはまったくありません。おかしな訳が混ざってしまうことも承知の上でそれでも情報を提供しようという方針は、それなりに検討された上での判断だと思いますし、機械翻訳でもそのままで十分意味が通じて役に立ちそうな情報()もたくさんありますから(それに、マイクロソフトって言うだけで脊椎反射みたいに「だめ」っていうのは、思考停止みたいでかっこ悪いしね)。
日本で、計算機による機械翻訳が本格的に試されるようになって50年ぐらいになるんじゃないかと思いますが、われわれ“言語的に試練を受けている”人たちの役にたつようになるまでには、まだまだ時間がかかりそうです。


私が大昔に卒業研究をした大学の研究室は、計算機による言語処理を長いことやっているのですが、その研究室の言い伝えによると、日本で1、2を争う最古の翻訳計算機に “Time flies like an arrow.”(時間は矢のように飛ぶ=光陰矢のごとし)を翻訳させたら「時間蝿は矢を好む」という結果がでたとか。この言い伝え自体は都市伝説の匂いもしますけど、このぐらいの誤訳は現在の翻訳ソフトでも普通に見られます。それだけ難しいテーマだということなのでしょう。
で、笑いの種にしているだけでは、これまた思考停止っぽいので、マイクロソフトのKBの誤訳をながめていて気付いた共通のパターンをいくつか。
1:略語、短縮語、専門用語を辞書に登録すれば改善しそうなケース

2:自社の製品名を登録すれば改善しそうなケース

3:KBの文書タイトルが Capitalize(単語の先頭を大文字にすること)されているために起こっている誤訳

人間が普通にできているごく簡単な自然言語の読解も、機械に真似させるのはなかなか難しい、というお話。どっとはらい。

投稿者 樋口 理

「時間蝿は矢を好む [機械翻訳]」に16件のコメントがあります
  1. ゴメン。
    コメントを自分のBlogに書いちゃいました。 美味し過ぎたもので・・・。
    明日は山女を釣ってきて味噌田楽にして食うつもりです。 沢山釣れたら、燻製にして写真だけをHPに載せて、一人でバーボンの肴にして食うつもりです。

  2. なるほど、「果物はバナナのように飛ぶ」か。 いいなあ。
    (釣果を自慢するのは下品なので、控えておきます。)

  3. 今は 404 になっていますが、NIKKEI NET に「ボーイング社の、戦闘機給油用の 100 隻のタンカーが云々」という記事が載ったことがあります。
    もちろん、「タンカー」を「空中給油機」と訳すのを知らなかったが故の失敗ですが、どこの業界でも、専門用語は翻訳における鬼門なのかもしれませんね。イラク戦争中に、ペンタゴンのプレスリリースを片っ端から翻訳ソフトにかけたら、これまた珍訳続発でしたし。

  4. おかしい

    “犬:対話機能がわかりましたか。 つかれた画面。”
    133231 – 犬:対話機能がわかりましたか。 つかれた画面。
    マイクロソフトのナレッジベースで英文からの機械翻訳機能が使えるそうです。その例の一つがこれ。笑えま…

  5. 100隻のタンカーは壮大ですね。
    特に専門家同士の日常会話だと、キーになる専門用語があるおかげでどうにか意味が通じるっていうこともよくあるのに、機械だとそうはいかないというのも、考えてみれば皮肉なもんですね。

  6. これ、全部リバースして英訳したら原文に戻るかも。。。?

  7. 小ネタをもうひとつ。
    http://support.microsoft.co
    「WD2000:言語 AutoDetect(兄ちゃん)を使用する場合、 CPU 使用率が増加します。」
    これは、1のパターンですね。

  8. 某M社のさぽーとぺーじ

    今日会社で面白いブログを見つけて大笑い。 だけど、どこだったか忘れちゃった^^;

  9. 久々に覗いてみれば、ま~た懐かしいお話を・・・
    本題のマイクロソフ㌧の例については、とにかく専門用語登録しまくって、単語単位の対訳を充実させれば、ある程度珍訳を防げる可能性はありそうですね。
    一方、某研究室での言い伝えの例、
    Time flies like an arrow.
    時は矢のように飛ぶ
    時蝿は矢を好む
    矢のような蝿を計測せよ
    矢のように蝿を計測せよ
    ・・・
    おまけで似たような例、
    I saw a girl in a park with a telescope.
    望遠鏡で公園にいる少女を見た
    望遠鏡つきの公園にいる少女を見た
    ・・・
    これらは辞書登録どうこうではなく、係り受け解釈の問題ですよね。しかも誤りというより、単文での情報しか与えられないケースでの係り受け解釈についての見解の相違といった方がしっくりくるかも。
    #もちろん機械翻訳を使うサイドからすれば
    #明らかな誤りであることに間違いはないの
    #ですが・・・
    機械翻訳、色々難しい面はあるわけですけど、かたや、BBSだ、chatだ、その他なんだで、確実に異言語コミュニケーションの可能性を広げているのも確かなわけで、それはそれで大したもんだなあ、と思ったりもします。
    ま、もうちょっとしばらくの間は、翻訳誤りを面白がる、楽しむような余裕もあっていいかなと思います。その意味でこのblog記事はイイ感じですな。面白がりながらでもみんなが使っていけば、技術はまた進歩していきますよ、きっと。

  10. おお、これはこれは。専門の研究者の方からコメントをいただくと、びびるなぁ。
    ま、そういうわけで、みなさん。いろいろおかしなところもあるでしょうが、生温かく見守っていこうじゃあーりませんか。

  11. あいや、あたしゃ機械翻訳屋ではないので、専門家の称号は謹んでご辞退申し上げるです。
    でもま、ここでのKB翻訳の例も含めて、「とくかく使っちゃえ」という思い切りと、その結果起きる様々な現象を面白がる雰囲気も時には必要かなと思うのです。
    ところで、挙げられているような珍訳事例がベンダ側にフィードバックされたりして、その結果どうにかなるなんてことはあるんでしょうかね?

  12. 風のうわさに、笹塚には「善意のコメント」が続々と寄せられていて、ご担当なさっているみなさんは機械翻訳を育てていく意欲満々だと伺いました。ご同慶の至りです。
    (とはいえ、機械翻訳のエンジンそのものは、自社製じゃないんでしょうけど……)

  13. うーん、ひょっとするとこれは、機械翻訳エンジンを改善するためのフィールド実験なのかもしれませんね。
    マイクロソフトが機械翻訳で KB を公開して云々といえば話題になるし、MS 贔屓の人も MS 嫌いの人も見に行っていろいろいうだろうし、結果として膨大なフィードバックが集まるという…

  14. ここ数日、KBのページを開いたときに、やたらとフィードバックフォームが出てくるようになったような気がするというタレコミがありました(毎日KBを眺めているというのもどうかとは思いますが)。
    本気でフィードバックを集める気になっているのかも……

  15. タレコミがありました。
    いつのまにか、修正していらっしゃるようです。上のリンクの例は、ほとんど何らかの手が入って、当初の珍訳ではなくなりました。
    ハングアップ、APE、Winなどは辞書登録したのか、普通に訳出されるようになっていますし、英語の文章をそのまま出すようになったものもあります。
    なんだか、ちょっとさびしいような……(笑)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です