higuchi.com blog

The means justifies the ends

時間蝿は矢を好む [機械翻訳]

[PR] 本ブログの商品紹介リンクには広告が含まれています

ここのところ、マイクロソフトのナレッジベース(正しくは「サポート技術情報」。以下、KB)に、はまっています。
KBは、世界中のサポート窓口に寄せられる製品についての質問を元に、それぞれの質問に対する回答を文書にしたデータベースです。特に英語で検索すると、本当にたいていの問題は答えが見つかるという、マイクロソフト製品(の障害)についての巨大な知識データベースです。
日本語だとヒットする件数がぐっと少ないのが難点です。たぶん、もとの情報が英語圏からのものが大多数で、日本語への翻訳が追いつかないためと思われます。その解決策として、最近、英語のKBをそのまま機械翻訳したものも検索結果に入れるというオプションがつきました。ところが、機械翻訳された文章の中に、素っ頓狂な珍訳が混ざっていて、これがなかなか楽しめます。
こんな感じ。誤解のないように断っておきますが、私は「だからマイクロソフトはダメだ」とかそんなことを言うつもりはまったくありません。おかしな訳が混ざってしまうことも承知の上でそれでも情報を提供しようという方針は、それなりに検討された上での判断だと思いますし、機械翻訳でもそのままで十分意味が通じて役に立ちそうな情報()もたくさんありますから(それに、マイクロソフトって言うだけで脊椎反射みたいに「だめ」っていうのは、思考停止みたいでかっこ悪いしね)。
日本で、計算機による機械翻訳が本格的に試されるようになって50年ぐらいになるんじゃないかと思いますが、われわれ“言語的に試練を受けている”人たちの役にたつようになるまでには、まだまだ時間がかかりそうです。 私が大昔に卒業研究をした大学の研究室は、計算機による言語処理を長いことやっているのですが、その研究室の言い伝えによると、日本で1、2を争う最古の翻訳計算機に "Time flies like an arrow."(時間は矢のように飛ぶ=光陰矢のごとし)を翻訳させたら「時間蝿は矢を好む」という結果がでたとか。この言い伝え自体は都市伝説の匂いもしますけど、このぐらいの誤訳は現在の翻訳ソフトでも普通に見られます。それだけ難しいテーマだということなのでしょう。

で、笑いの種にしているだけでは、これまた思考停止っぽいので、マイクロソフトのKBの誤訳をながめていて気付いた共通のパターンをいくつか。

1:略語、短縮語、専門用語を辞書に登録すれば改善しそうなケース2:自社の製品名を登録すれば改善しそうなケース3:KBの文書タイトルが Capitalize(単語の先頭を大文字にすること)されているために起こっている誤訳 人間が普通にできているごく簡単な自然言語の読解も、機械に真似させるのはなかなか難しい、というお話。どっとはらい。

コメント

Yaginumaさんのコメント:

ゴメン。
コメントを自分のBlogに書いちゃいました。 美味し過ぎたもので・・・。
明日は山女を釣ってきて味噌田楽にして食うつもりです。 沢山釣れたら、燻製にして写真だけをHPに載せて、一人でバーボンの肴にして食うつもりです。
2004/5/28 22:36

樋口 理さんのコメント:

下の句。Fruit flies like bananas.
2004/5/29 02:17

Yaginumaさんのコメント:

なるほど、「果物はバナナのように飛ぶ」か。 いいなあ。
(釣果を自慢するのは下品なので、控えておきます。)
2004/5/29 18:05

井上さんのコメント:

今は 404 になっていますが、NIKKEI NET に「ボーイング社の、戦闘機給油用の 100 隻のタンカーが云々」という記事が載ったことがあります。

もちろん、「タンカー」を「空中給油機」と訳すのを知らなかったが故の失敗ですが、どこの業界でも、専門用語は翻訳における鬼門なのかもしれませんね。イラク戦争中に、ペンタゴンのプレスリリースを片っ端から翻訳ソフトにかけたら、これまた珍訳続発でしたし。
2004/5/30 14:49

樋口 理さんのコメント:

100隻のタンカーは壮大ですね。

特に専門家同士の日常会話だと、キーになる専門用語があるおかげでどうにか意味が通じるっていうこともよくあるのに、機械だとそうはいかないというのも、考えてみれば皮肉なもんですね。
2004/6/1 02:22

miyanoさんのコメント:

これ、全部リバースして英訳したら原文に戻るかも。。。?
2004/6/1 09:06

樋口 理さんのコメント:

小ネタをもうひとつ。
http://support.microsoft.co...
「WD2000:言語 AutoDetect(兄ちゃん)を使用する場合、 CPU 使用率が増加します。」

これは、1のパターンですね。
2004/6/3 12:32

atsushiさんのコメント:

久々に覗いてみれば、ま~た懐かしいお話を・・・

本題のマイクロソフ㌧の例については、とにかく専門用語登録しまくって、単語単位の対訳を充実させれば、ある程度珍訳を防げる可能性はありそうですね。

一方、某研究室での言い伝えの例、

Time flies like an arrow.
時は矢のように飛ぶ
時蝿は矢を好む
矢のような蝿を計測せよ
矢のように蝿を計測せよ
・・・

おまけで似たような例、

I saw a girl in a park with a telescope.
望遠鏡で公園にいる少女を見た
望遠鏡つきの公園にいる少女を見た
・・・

これらは辞書登録どうこうではなく、係り受け解釈の問題ですよね。しかも誤りというより、単文での情報しか与えられないケースでの係り受け解釈についての見解の相違といった方がしっくりくるかも。
#もちろん機械翻訳を使うサイドからすれば
#明らかな誤りであることに間違いはないの
#ですが・・・

機械翻訳、色々難しい面はあるわけですけど、かたや、BBSだ、chatだ、その他なんだで、確実に異言語コミュニケーションの可能性を広げているのも確かなわけで、それはそれで大したもんだなあ、と思ったりもします。

ま、もうちょっとしばらくの間は、翻訳誤りを面白がる、楽しむような余裕もあっていいかなと思います。その意味でこのblog記事はイイ感じですな。面白がりながらでもみんなが使っていけば、技術はまた進歩していきますよ、きっと。
2004/6/6 02:07

樋口 理さんのコメント:

おお、これはこれは。専門の研究者の方からコメントをいただくと、びびるなぁ。

ま、そういうわけで、みなさん。いろいろおかしなところもあるでしょうが、生温かく見守っていこうじゃあーりませんか。
2004/6/6 19:31

atsushiさんのコメント:

あいや、あたしゃ機械翻訳屋ではないので、専門家の称号は謹んでご辞退申し上げるです。

でもま、ここでのKB翻訳の例も含めて、「とくかく使っちゃえ」という思い切りと、その結果起きる様々な現象を面白がる雰囲気も時には必要かなと思うのです。

ところで、挙げられているような珍訳事例がベンダ側にフィードバックされたりして、その結果どうにかなるなんてことはあるんでしょうかね?
2004/6/6 21:17

樋口 理さんのコメント:

風のうわさに、笹塚には「善意のコメント」が続々と寄せられていて、ご担当なさっているみなさんは機械翻訳を育てていく意欲満々だと伺いました。ご同慶の至りです。
(とはいえ、機械翻訳のエンジンそのものは、自社製じゃないんでしょうけど……)
2004/6/8 00:26

井上さんのコメント:

うーん、ひょっとするとこれは、機械翻訳エンジンを改善するためのフィールド実験なのかもしれませんね。
マイクロソフトが機械翻訳で KB を公開して云々といえば話題になるし、MS 贔屓の人も MS 嫌いの人も見に行っていろいろいうだろうし、結果として膨大なフィードバックが集まるという…
2004/6/8 08:45

樋口 理さんのコメント:

ここ数日、KBのページを開いたときに、やたらとフィードバックフォームが出てくるようになったような気がするというタレコミがありました(毎日KBを眺めているというのもどうかとは思いますが)。
本気でフィードバックを集める気になっているのかも……
2004/6/9 00:48

樋口 理さんのコメント:

タレコミがありました。

いつのまにか、修正していらっしゃるようです。上のリンクの例は、ほとんど何らかの手が入って、当初の珍訳ではなくなりました。
ハングアップ、APE、Winなどは辞書登録したのか、普通に訳出されるようになっていますし、英語の文章をそのまま出すようになったものもあります。

なんだか、ちょっとさびしいような……(笑)
2004/6/16 17:07

コメントを書く

関連するかもしれない記事

フィッシング詐欺メール

重要なVISA所有者! [フィッシング]

して拡大ここのところ、フィッシングの横行が新聞などでも取り上げられています。フィッシングといって...

この記事を読む »

これは Web のほんやくコンニャクになるかもしれない

これは Web のほんやくコンニャクになるかもしれない

Google の機械翻訳サービス「Google 翻訳」が飛躍的に進化して、一部のみなさんがざわついています...

この記事を読む »

謎のメッセージ

Spend Wisely! [ウィンドウズ起動の巧み]

先月ぐらいからだったか、Web をうろついているとあちこちのページでこんな謎の Google AdSense 広告メ...

この記事を読む »

Symphonyの画面

昔の名前で出ています [Lotus Symphony]

オンラインのニュース見出しを流し読みしていたら、IBMがオフィススイートを無償で公開するという記事が...

この記事を読む »

これだけ? [FolderShare]

P2P 技術を使ってネットワーク越しに複数のパソコンのフォルダの中のファイルを自動的に同期してくれる...

この記事を読む »

属人的組織は続かない [Built to last]

先日、アメリカのとある(小さな)業界トップの会社の経営メンバーが退任するというニュースを聞いたと...

この記事を読む »

Saving Microsoft

底力? [なんだかんだ言ってもマイクロソフトは強い]

たまたま、通勤鞄の中の雑誌が2誌ともマイクロソフト特集。どちらもなかなか面白い。 一つは Wir...

この記事を読む »

たまには私的なこと [恩人の新機軸]

たまにはごく私的なことを。 マイクロソフトの宮田さんと、ひさしぶりにお会いしてクローチェ・エ・...

この記事を読む »

Microsoft Bobは誰のせい? [ビル・ゲイツの最終出社日]

気がついたら年が明けていました。この業界の年明け一番のイベントと言えば、米国のCES(コンシューマー...

この記事を読む »

エコシステム [Androidスマホを「Android 4.0」へアップデートするのが難しい理由の根っこのところ]

先日 Gizmodo に掲載されていた『なぜAndroidスマホを「Android 4.0」へアップデートするのは難しく...

この記事を読む »