日本のニュースが・・・

Leopard Debut

売れる LeopardBCN

日本のマック事情が英語ニュースに登場することは滅多にないが、珍しくマックメディア(MacworldMacNNArs TechnicaHardMac)で取り上げられた記事がある。

Leopard の販売本数がウインドウズ OS を超えたというものだ。

Macworld: “Leopard mauls competition, takes half Japan retail market” by Martyn Williams: 14 November 2007

     *     *     *

Market Share-1

Leopard のシェアが過半数を超える:BCN

アップルの新しい Leopard は、この10月、日本の OS マーケットに大幅に食い込んだ。発売期間が10月最後の6日間だけだったにも拘らず、OS パッケージ総売上げの過半数を占めるに至った。

Apple’s new Leopard operating system took a sizable bite of the Japanese retail operating system market during October and accounted for over half of all sales of packaged operating system software despite being on sale for only the last six days of the month.

Tiger など他の OS まで含めると、アップルの10月のマーケットシェアは 60.7% にも達した。前月のシェア 15.5% に比べても大幅増だが、その数字自体アップルにとって 2007 年最高のものだった。

Combined with other sales of other operating systems including Tiger, Apple had an overall 60.7 percent share of the market in October — that’s a big jump from the 15.5 percent share it had in September, which was itself the highest share Apple had managed to get so far in 2007.

このあと何故かという分析がはいって、それぞれのメディアの特色が出ることになる。

     *     *     *

この記事は内容もさりながら、ニュースの伝播(でんぱ)という点でも大変おもしろい。

実はこの記事、日本の「BCN ランキング」がベースになっている。

BCN ランキング: “Leopard」が猛烈な初速、アップルの新OS10月販売シェア53.9%を記録” by 中村光宏: 08 November 2007

ご丁寧なことにグーグル翻訳までついている。

日本の事情を直接入手できる英文ソースがないため(?)、グーグル翻訳を使ったものと思われる。

BCN の元記事を機械翻訳した冒頭の部分はつぎのとおり・・・

     *     *     *

[元記事]アップルは10月26日、新OS「Mac OS X 10.5 Leopard」(レパード)を世界同時発売した。「BCNランキング」で集計したところ、発売以後わずか6日で10月1か月間の「OS」パッケージ販売本数で過半数の53.9%を占めシェア1位を獲得。猛烈なスタートを切ったことがわかった。

[グーグル翻訳]Apple is October 26, the new operating system “Mac OS X 10.5 Leopard” (Leppard) simultaneous world release. “BCN ranking” in the aggregate, released after just six days on October 1 Month “OS” package sales of a majority 53.9 percent share topped. Savage started it all.

     *     *     *

翻訳の方は主語や述語がはっきりせず単語の羅列という感じだが、機械翻訳の現状ではこれが精一杯なのだろう。

グーグル翻訳がどんな感じなのか、機械翻訳された英語を再度日本語に訳してみる。

[グーグル再翻訳]アップル社は10月26日、新しいオペレーティングシステム”のmac os x 10.5ヒョウ”(レパード)の世界同時リリースします。”bcnランキング” の集計では、わずか6日後にリリースされ10月1日の月”os の”パッケージの売り上げの過半数53.9%シェアを超えました。荒涼とし始めています。

まあまあと感じるか、それともこれじゃと感じるか。少なくとも原文からどのくらい隔たったかという感じはつかめるのではないか。

現在の機械翻訳の実力の一端を示すものといえよう。

     *     *     *

ここでグーグル翻訳を取り上げたのは、機械翻訳をあげつらうためではない。

機械翻訳が理想にはほど遠いとするなら、ここにこそ大きなビジネスチャンスがあるのではないかといいたいのだ。

日本から情報発信するためにも、優れた翻訳ソフトがあったらと考えるひとは多いのではないか。

漢字変換ソフトとは同一視できないにしても、日英翻訳ソフトは日本人が得意とする分野のはずと考えるひとがいてもおかしくはない。

翻訳ソフトの善し悪しを決めるのは、決して言語解析などのアルゴリズムだけではない。辞書作成や使い勝手とも大いに関係する。エンジニアに加えて辞書作成者、翻訳者などとの共同作業があって初めてきちんとした翻訳ソフトが出来るのだと思う。

特定のワープロやプラットフォームと結びついた「こちら側」のソフトではなく、ネット上の「向こう側」の翻訳ソフトが出れば、その恩恵に与るひとの数は計り知れないのではないか。

そういうものが出来れば、日本からの情報発信が増すだけでなく、海の向こう側にスピンアウトするチャンスも出てきそうな気がする。

     *     *     *

日本のお家芸だから日本人にしか出来ないとタカをくくっていると、もっと大きな波に攫(さら)われる可能性もある。

タダの機械翻訳を最初に導入したグーグルは、すでにつぎの段階に取り組んでいるという記事を読んだ覚えがある。

はっきりは記憶していないが、言語の構造分析に基づくアルゴリズムではなく、異なる言語の中にパターンをみつけて、それを対比させる形で翻訳しようとする試みらしい。

国連文書のように最初から多言語で書かれたデータはうってつけだという。

グーグルが大学や図書館と組んで世界中の文書を片っ端からスキャンしているのは周知の事実だ。スキャンするのは英語に限らず他の外国語も含まれる。

こうして出来た膨大な複数言語データベースを使って、特定のパターンをマッチさせるという新たな手法を使うと、その先に何が出てくるのか大変興味深い。

遅々として進まない機械翻訳を飛び越えて、まったく新しい翻訳ソフトの世界が開けるかもしれない。しかもこの方法なら言語構造を問わずどの言語にも適用できるのだ。 

日本語は特殊だからといって胡座(あぐら)をかいているわけにはいかない。

日本の与(あずか)り知らないところでまたひとつ新しい技術が開発されるかもしれないのだ。

Technorati Tags: , , , ,

コメント / トラックバック10件 to “日本のニュースが・・・”

  1. ナカノ Says:

    googleのは統計的機械翻訳のことだと思うけど、
    それ自体はそんなに新しい技術じゃないし、日本でもちゃんと研究してますよ。
    でもグーグルは量がとてつもないから、新しいとこに行くのかなー

  2. TORIO Says:

    情報発信有り難うございます。そして再開されたこと、おめでとうございます。
    翻訳の問題のご意見も実に参考になります。MacとLeopardについては海外と日本人の感覚は違うとは以前から感じています。MacはIntelになっても日本では売れないという感じでした。これは多くのユーザーがLeopard待ちだった。いま、Macは日本のランキングを見てもダントツで売れマックているようです。そして、いままでintel Macを購入した人も早くLeopardにバージョンアップすることを待ち望んでいた。皆さんTigerはβー版状態ということを認識されていた。現に私が持っていたIntel Tigerの不具合はLeopardによって解消された部分もあります。結論は日本人は慎重だったということでしょう。Apple USも日本をもっと理解して重視すべきでしょう。

  3. shiro Says:

    > ナカノ さん
    自分でもどこで読んだのかウロ覚えだったので、改めて探してみました。

    グーグル翻訳プロジェクトを担当する Franz Och について書かれたロイターの記事でした。

    Reuters: “Google seeks world of instant translations” by Adam Tanner: 28 March 2007
    (http://www.reuters.com/article/technologyNews/idUSN1921881520070328?feedType=RSS)

         *     *     *

    Google’s approach, called statistical machine translation, differs from past efforts in that it forgoes language experts who program grammatical rules and dictionaries into computers.

    Instead, they feed documents humans have already translated into two languages and then rely on computers to discern patterns for future translations.

    While the quality is not perfect, it is an improvement on previous efforts at machine translation, said Franz Och, 35, a German who heads Google’s translation effort at its Mountain View headquarters south of San Francisco.

         *     *     *

    ナカノさんのおっしゃるとおり、statistical machine translation(統計的機械翻訳)と呼ばれるのもののようですね。

    日本でも研究されていると伺って安心しました。大いに期待したいものだと思います。

         *     *     *

    ただ、機械翻訳の翻訳モデルについては、学習というかブラッシュアップはどのようになされるのでしょうか。

    たとえば、日本にもたくさんいるすばらしい通訳や翻訳家の力を借りることは考えられないのでしょうか。

    機械翻訳の現実と、人間の訳したものの懸隔を見せつけられると、理論やアルゴリズムだけでなく人間との協同作業がもっと必要なのではないかという気がするのですが・・・

  4. Top Posts « WordPress.com Says:

    […] 日本のニュースが・・・ [image] […]

  5. Arageo Says:

    おそらくーーー誤訳されたのでしょう。この記事はたしかにUS Mac communityに大きく取り上げられています。じっさいは単にLeopard発売直後の熱狂で、瞬間風速的にVistaの販売を上回っただけですよね。これで日本におけるmarket shareを論じるのはいかがなものか(笑)ーーーまっしかし、これまでは”瞬間風速”さえおきなかったのですから、昨今のMac OSの 人気はまちがいないでしょう。さて、おもわず笑ってしまったのは、この記事に関して日本人のIQが高いからだという人がいたこと(MacBreak Weekly 66)ーーーWin userが聞いたら怒りまっせ(笑)。

  6. +.kだいひょう Says:

    お帰りなさいませ(笑)。
    シローさん自身の言葉が記事の半分以上を占めているのを
    初めて見た気がします。
    良い文章を読ませて頂きました。
    お体には無理をさせずボチボチと行って下さい(笑)。

  7. ナカノ Says:

    統計的機械翻訳は元の文章と対訳(例えば新聞の日本語版と英語版の記事)を
    統計的に比較学習させるので
    元になる翻訳がとても重要になります。従来の手法より翻訳家への依存度が高くなったとも言えます。

    グーグルのFAQにも、
    http://www.google.com/intl/ja/help/faq_translation.html#statmt
    >品質を改善するには、2 か国語で記述された大量のテキストが必要です。 ご提供いただけるような、大量の 2 か国語または複数言語のテキストがございましたら、Google までご連絡ください。
    と書いてあります。

    シローさんも是非協力してあげてください^^;

  8. shiro Says:

    > +.kだいひょう さん
    当ブログでは 元の記事そのものが主役なので 私はなるべく黒子に徹するようにしています

    > ナカノ さん
    グーグル翻訳はよく使うのに グーグル FAQ は見たことがありませんでした
    統計的機械翻訳のことも知らなかったので 今回は勉強になりました ありがとうございました

  9. satomi Says:

    そうそう、ギズモとかもネタ元リンクに海外メディアのURL直接載せる代わりにGoogle機械翻訳のURL載せてますよね。SEO的にはアレなんですが、英語圏の人にはその方がひと手間親切、ってことでしょうね。 機械翻訳のどこまでも外れていく危なっかしいところも、読む方はたぶん、織り込み済みだと思います。BCNランキングはグラフが目に分かり易いですし。

  10. shiro Says:

    > satomi さん
    |機械翻訳のどこまでも外れていく危なっかしいところも、読む方はたぶん、織り込み済みだと思います。

    そうなんでしょうね
    機械翻訳を利用するには そのくらいの気持ちでないと いけないんでしょうね
    細かいニュアンスが失われたり おかしな訳語になっても 何についていっているかさえ分ればいいというぐらいの・・・

    折角なら 翻訳結果をブラッシュアップする手段も ビルトインされていればいいのですけれど・・・

    情報発信をしようとする場合には ウェブではどうしても行き違いが生じてしまう可能性があるので 機械翻訳をカンバンにすることには 危険が伴うかもしれません

    文字だけの記事と ハッとする画像もついている場合では たしかに後者の方が目を引きやすい
    海外向けにも発信したいと考えて 機械翻訳でもしてみようという気を起こさせるには 画像を工夫するのも ひとつの手かもしれませんね

コメントは受け付けていません。


%d人のブロガーが「いいね」をつけました。