WirelessWire News Technology to implement the future

by Category

クリステンセン教授の先見性と、アップル「Siri」の潜在力 - Asymco

2011.10.19

Updated by on October 19, 2011, 18:57 pm JST

ハーバード大学ビジネススクール時代の恩師であるクレイトン・クリステンセン(Clayton Christensen)教授--『イノベーションのジレンマ』などの著者--は、2004年3月に「Open Source Business Conference」で講演を行った(この講演の模様を録音したものが、リンク先のページ「Capturing the Upside」で聴ける。「破壊的なイノベーション」("Disruption")の核心に触れた話が聞けるので、ぜひ始めから終わりまで通して聞いてみることをお勧めする)。

この講演のなかには(市場)分析に関する多くの分野で役に立つ教えが含まれている。そしてiPhone 4Sに搭載された「Siri」の潜在力について考える時、私はこのなかで語られている、次のような話を思い出す(7年半も前にこんな話をしていたなんて、教授には先を見通す千里眼があるのではないか)。

...この次、コンピュータを扱う大手量販店に出かけた時には、音声認識ソフトがならんだ棚に足を運び、IBMの「ViaVoice」という製品の箱を手に取ってみてほしい。別に買う必要はない、ちょっと自分の目で確かめるだけでいい。その箱には、IBMが想定するユーザーの姿が印刷されている。コンピュータの画面に向かい、ヘッドセットを着用して、キーボードを叩く代わりに音声でテキストを入力している女性秘書の写真だ。

この女性に向けてIBMがアピールしなければならないViaVoiceのメリットについて考えてみよう。彼女のタイピングのスピードは1分間に90ワード、タイプ入力の精度は99%だ。大文字を入力する際には、ごく自然にシフトキーに小指が伸びて、楽々と作業をこなしてしまう。そんな相手に対して、IBMは「もうキーボードを叩く必要はありません。このヘッドセットを着けて、ゆっくり、はっきりと、一定のペースで、文章全体を読み上げる練習をしてみてください。大文字を使うときには、いったん間をとり、"大文字で"("capitalize")と言ってから、次に大文字にしたい言葉を話し、最後に"大文字部分を終了"("uncapitalize")といったあと、また間をあけてください。いまの認識精度は70%なので、少し辛抱していただく必要がありますが、これからもっと精度が上がることは請け負います」といったことを口にしなくてはならない。

こんな話をされた女性は、この音声認識ソフトにちっとも魅力を感じないだろう。そしてIBMは--同社と実際に仕事をしたことはないが、私が理解しているところでは--これまでに推定7億ドルもの資金を注ぎ込んで、音声認識技術の向上に取り組み、ビジネスの現場で使える程度のレベルまで精度を引き上げようとしている。ただし、そのための技術的なハードルを超えるのはとても難しい。そのいっぽうで、IBMが音声認識技術の開発に積極的な投資を続けている間に、レゴ(LEGO)は「とまれ」「進め」「左へ」「右へ」といった言葉がわかるロボットを世に出した。このロボットで遊ぶ子供たちは、4つの単語がわかるだけでも大喜びしたが、その次には電話の自動応答システム--「1を押すか、もしくは"イチ"と言ってください」( "press -- or -- say -- one" )といった類の応用例が根付き、そしていまではディレクトリーアシスタント(=カーナビシステム)がドライバーに目的地の名前を訊ねるようになったりしている。この方向性の先には、ある興味深い市場ができてくるだろう。

音声認識技術が次に定着するのは、きっとチャットルームだと私は考えている。子供たちはスペルチェックもしなければ、文章の頭でわざわざ大文字を使うようなこともしないという理由もあるが、いずれにしても彼らはキーボードを打つより喋るほうを好むだろう。そして、たぶんその次に定着するのは、ごつい指でBlackBerryの小さなキーボードをつついてメールを書いているようなビジネスマンの世界だろう。BlackBerry端末のキーは、彼らの指の4分の1くらいの大きさしかないので、タイピングの精度はたかだか70%程度(つまりViaVoiceの精度と変わらない)。こうしたユーザーに、完璧なものでなくてもいいから、まあまあ使い物になる程度の音声技術を与えれば、彼らは不器用に小さなキーを叩く代わりに音声を使ってメールを書くようになる。彼らはそのお粗末な製品に、きっと大喜びするだろう。そして、ゆくゆくはキーボードのかわりに音声入力で文章を作成できるレベルまで、音声認識技術の質が向上するだろうが、ただしそうなるまでには長い時間が必要だ。

Siriについてまず思い浮かぶのは「なんとお粗末("crummy")なんだろう」ということ。アップルはSiriを「インテリジェントなアシスタント」にしようとしているが、現状は「使い物になる」レベルとはほど遠い。「おもちゃのようだ」という人も多い。興味深いところがあまりにもないので、発表直後をのぞけば、Siriのことを扱った記事はほんのわずかしか出ていない。Siriを「単に新しい機能のひとつに過ぎない」という皮肉屋もいたが、そうした発言も許せるほどいまのSiriはお粗末だ。

しかし、である。Siriには実際に「十分使い物になる部分」も確かにあるようだ。できれば誰かにやってもらいたい、それほど大したことのない一部のタスク---カレンダーへの予定の入力や、文脈を踏まえた検索、そして予想もしないような愉快な反応などに限っての話だが。また、いろんなことをしようと欲張っていないのも、Siriの良いところである。タイピストの代わりになろうともしていない。片時も離れず寄り添う「同伴者」になろうとするわけでもない。ユーザーよりも頭がよくて、「自分など役立たずだ」と思わせるような部分もない。ただ、ユーザーの生活に潤いを与えようとするだけ。そして、それがiPhone 4Sのユーザーに大受けしている秘訣でもある。

子供が大喜びしたLEGOのロボットと同じように、Siriはシンプルな能力でユーザーを喜ばせることができる。いまはまだ大したことはできないが、クリステンセン教授が講演のなかで指摘していたように、この力は破壊的なイノベーションへと成長するために必要な最初の一歩だ。この後には長い道のりが続くことだろう。Siriはもっと良くなる必要がある。そして、少なくとも2億人のユーザーがいずれSiriを使うようになることから、その性能はかならず向上すると私は思う。時間の経過と共にもっと多くのタスクをこなせるようになり、われわれがいまは可能性を思いつくだけで、実際にはできないような目的にもいずれは役立てるようになるだろう。タッチスクリーンが登場した時も、ちょうど同じような感じだった。あの技術が広く普及したことから、われわれが4年前にはできるとは思わなかったようなことが、いまではスマートフォンやタブレットで可能になっている。

ただし、そうなるまでには時間がかかる。ほんとうに役に立つ画期的な技術は成熟するまでに長い時間を要するものであり、その点についてはSiriも例外ではない。そして、あらゆる破壊的なイノベーションの例と同じく、Siriの潜在力は次の4つの原則に根付いている。

  1. その技術は当初、慎ましい目標を掲げて投入され、そしてしっかりと目標を達成する("Humble early goals which it accomplishes well")
  2. 数多くの熱心なユーザーが存在し、その技術に実体を与える
  3. その技術には大きな伸びしろがあり、ユーザーからのフィードバックを取り込みながらいろいろな領域に成長していく可能性がある
  4. 安定した収入があるガマン強い支援者が存在する

ある技術を「破壊的なイノベーション」に育て上げるといっても、実際には地道な事柄の積み重ねであり、魔法のようなやり方などはない。子供を育てたことがある人なら誰もが知っているように、そこにはいつくかの原則が存在するだけである。

(執筆:Horace Dediu / 抄訳:三国大洋)

【原文】
Clayton Christensen and Siri

[訳者補足]
クリステンセン教授の講演("Capturing the Upside")は全体で108分もある長いものだが、当該の部分は1時間8分あたりで登場してくる。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら