どうも、太陽です。(No26)
日本の目指すべきAI戦略について、「ダブルハーベスト」という本を参考にしてまとめます。興味がある人は続きをお読み下さい。
1 ダブルハーベストのループ構造とは?
本によると、ダブルハーベストの典型例として、Amazonが挙げられています。戦わずして勝つ、または1回勝ったら終わりではなく、ずっと勝ち続けるのが正しい戦略です。Amazonはずっと勝ち続ける仕組みを構築したのです。
・ | ユーザーが喜ぶ体験を提供し、顧客がどんどん集まる。 |
・ | そうなると、売り手もAmazonに出品し、商品セレクションが充実し、さらにユーザーがハッピーになる。 |
売り手がたくさん集まれば買い手を呼び、買い手がたくさん集まればさらに売り手を呼ぶ、「相互ネットワーク効果」をつくりだしたのです。
売り手・買い手の双方のデータ、それらをつなぐ取引データのすべてが溜まる構造になり、これら全てのデータを使うことで様々な最適化を目指すことを、「農作物の収穫」になぞらえて「ハーベストループ」と呼びます。
このループを回すだけでも効果が高いのに、さらに裏側にべつのループ構造を回したのがAmazonです。それは1つ目のループで持続的な成長が可能になり、スケールメリット(規模の経済)が出て、徹底的な「低コスト構造」を作り出したことです。
それによって、他社には真似できない「低価格」を実現し、さらにユーザーの顧客体験を向上させました。(Amazonの実態は巨大な物流システムを抱えたリアルビジネスであり、規模の経済が働けば、それだけ低価格にできるのです)
クラウドサービスのAWSが収益に貢献するようになるまで、Amazonは利益をほとんど出さず、物流に再投資し続けました。Amazonはダブルハーベスト(2つの収穫)を手にしたことで、現在の盤石の地位を築いた成功企業なのです。
ダブルハーベストの事例として、イスラエルのモービルアイも本書では挙げられています。(モービルアイは、車載カメラによる車両検知や事故防止システムを提供する企業) わずか600名ほどの社員しかいませんが、2017年に1兆7000億円でインテルに買収されました。
1 | 路面状況の画像データを大量蓄積し、クラウド上に高精細なロードマップを描けることで、事故が防げるようになると同時に、画像処理AIが強化されて、事故予測Aiの精度が上がるのが1回目の収穫。 |
2 | 蓄積された路上画像データに位置情報を紐付けることで、高精細なマップをリアルタイムに更新できるようにし、これによりマップの精度が上がり、更新頻度も上がれば事故予測AIの精度がさらに高まり、これが2回目の収穫。 |
3 | 別のループとして、シュミレーションデータの精度を上げることで、人とAIのコミュニケーションミスを減らすモノもあります。 |
1つの精度が上がれば、別のデータがとれるようになり、そのデータをもとにさらにAIの精度を上げていくことで、他社が簡単には追いつけない強力かつ持続的な競争優位性を獲得できるのです。
実務におけるループを回すことで実務の精度が上がれば、結果的にリスクをコントロールできるようになり、それが新しい保険商品の開発や、投資・融資の判断基準に革命をもたらすので、保険商品や投資商品というフィンテックがらみのループも回せるようになります。
2 ヒューマン・イン・ザ・ループとは?
人間はAIのサポートによって潜在能力を開花させ、AIは人間の教育によってさらに賢くなる、つまり人間とAIのコラボレーションにこそ価値があります。
人間とAIのコラボレーションを「ヒューマン・イン・ザ・ループ」と呼び、「自動化」とは区別されています。例えば、手書きの種類からOCR(光学文字認識)で文字列を読み込んでテキストデータを抽出するAIがあるとします。
AIによる認識の信頼度をあらかじめスコア化し、信頼度が仮に98点以上なら、そのまま結果として出力し、97点以下なら人間の目でチェックします。
つまり、AIが「自信がある」ものは人間の目を通さずにそのままOKとし、「自信がない」ものだけ人間が実際に目で見て確認して、間違いがあれば修正して結果に反映させるのです。こうすると、人間が全部目を通すよりも手間が省けますし、最終的なアウトプットのミスも減ります。
さらに、人間によって誤りが修正されたデータをもう一度AIに学習させることで、AIの認識精度をさらに上げる「追学習」も可能です。AIの学習には人間が不可欠なのです。
AIが7割正しく読み取れるなら、人間がチェックするのは残りの3割程度でよくなり、チェックする人数も減らせます。(ここから、さらに様々な好循環のプロセスもありますが省略します) 3割自動化しただけでも、相当なコストダウンにつながります。
「精度が低すぎてAIを使う意味がない」論は間違っていると著者は主張していますが、詳しくは本で。
ヒューマン・イン・ザ・ループは例えば、AIの精度が80%なら、残りの20%を人間が穴埋めしてあげる発想ですが、この穴埋めの仕方にはだいたい3つのパターンがあります。詳しくは本で。
ヒューマン・イン・ザ・ループは、「AIができない部分を人間がサポートする」面が強かったですし、AIが学習を重ねて賢くなれば、人間がサポートする領域はだんだん減っていきます。自動化によって従来の人間の仕事が置き換えられていくわけで、コスト削減・業務効率化の話になりやすいです。
しかし、AIを使うメリットはそれだけにとどまりません。弁護士や会計士、建築士や医師、エンジニアや研究者、コンプライアンスマネジャーなど、高い専門技能を持つ「エキスパート(専門家)」たちに対して、ヒューマン・イン・ザ・ループのフレームを当てはめると、もともと付加価値の高い希少人材なだけに、コスト削減以上の意味があることになります。
第一に、専門家本人にとってメリットがあり、自分たちの専門範囲外の簡単な日常業務をAIが代わりにやってくれれば、自分にしかできない骨のある仕事に集中でき、やりがいも感じられます。
さらに、弁護士本人がタグ付けなどのアノテーション作業を手伝えば、AIの精度もどんどん上がります。(アノテーション作業は専門知識が求められ、クラウドソーシングなどに外注できません)
このような専門家をサポートするタイプのコラボを「エキスパート・イン・ザ・ループ」といいます。専門家を専門領域以外の雑務から解放して、専門領域に特化させることによって、コスト削減以上の効果を得られるメリットがあります。
さらに、AIを使う側だけじゃなく、サービスを受けるユーザー側にも大きなメリットがあり、例えば、極端に安く、専門サービスを受けられるようになります。(一部しか利用できなかった高額なリーガルサービスが誰にでも利用できるようになります)
AIと人間のコラボは、社内人材やエキスパートだけにとどまらず、ユーザーに参加してもらってAIの精度を上げていく「ユーザー・イン・ザ・ループ」というアプローチもあります。その典型例は、グーグル翻訳の右下についている翻訳結果のコポーボタンです。(詳しくは本で)
AIはすでにコモディティ化しており、誰でも利用可能なAIのモジュールが公開されていて、それらを組み合わせるだけで、簡単にAIの恩恵を享受できます。
APIやライブラリから必要な機能を引っ張ってきて、それらをロゴブロックのように組み合わせるだけでいいのですが、それだと、借り物の寄せ集めなので、全体で65%ぐらいの精度までしか高まらないかもしれません。
借り物から脱出するためには、自前でAIモデルを構築することであり、パーツの寄せ集めを脱すれば、最初から最後まで一気通貫でAIをトレーニングできます。これを「E2E学習」と呼び、ハーベストループを回し続けるための前提となります。(AIの精度なら、85%以上を達成できるかもしれず、コスト競争力、サービスの質で差をつけられます)
パソコン業界では水平分業の世界で、日本は敗北しましたが、自前ですべてコントロールするE2E学習のAIの世界では、日本企業が最も得意としてきた垂直統合モデルであり、活きるのです。
3 AIで何を実現するかを見極める。
すでに世の中にたくさんあるAIのユースケースを分解していくと、AIが発揮している価値は5つのパターンに集約できることが分かります。これを「最終価値」と呼び、AIを使うと何ができるのか、結局どんな価値が実現できるのか、ということです。
1 | 売上増大。 |
2 | コスト削減。 |
3 | リスク/損失予測。 |
4 | UX(ユーザー体験)向上。 |
5 | R&D(研究開発)加速。 |
これら5つの最終価値ごとに、役に立つケースを分類した図が、本には載っています。(詳しくは本で)
「データ・イズ・キング」(大量のデータが必要な時代)が終わり、「レスデータ」(データはそこまでいらない)の時代になりました。以前なら1000単位のイヌやネコのサンプル画像が必要だったのが、現在は場合によっては5枚もあれば十分、なのです。
それが可能になった理由は「GAN 敵対的生成ネットワーク」という技術的なブレークスルーがあったからです。GANとは「フェイク画像を生成するAIと、その画像がフェイクだと見破るAIを競わせて、いかにも本物っぽい画像データをつくる仕組み」をいいます。
精度が上がれば、人間でも見破るのが困難なデータも生成できるようになり、これにより、ディープラーニングに1000枚の画像が必要だとしても、そのうちの800枚、900枚をGANが自動生成することが可能になりました。
特に異常を検知するAI(建物や橋、トンネルなどの建造物の壁面にヒビがあるかどうか)において、GANにより、それっぽいヒビの入った写真を大量に生成できるようになり、異常検知の精度を高めることができました。ちなみに、偽ブランドを見破るAIにおいても、GANは大活躍し、真贋を見極めるAIがつくられました。
もう一つの革命は「トランスファーラーニング(転移学習)」です。
これは、ある領域で学習したAIを別の領域Yの学習にスライドさせる技術で、Xで学習済みのAIはYをゼロから学習するよりも、はるかに効率的に学習できます。(ある専門家が、別の専門分野に活かすときに短時間で済むのと同じように、横展開するのはたやすいのです)
法律文書に特化したAIエンジンを作る場合、以前は法律文書だけで学習用データを全部揃えなければいけませんでしたが、トランスファーラーニングを使うと、99%は一般の自然言語(ウィキペディアのようなパブリックデータなど)で学習させておいて、残り1%だけ法律文書で学習すれば、一気にファインチューニング(微調整)され、専門性が高いAI(法律文書特化AI)を作れます。
GANやトランスファーラーニングの登場で、データを大量に持たなくてもAIが作れるようになったので、差別化が難しくなりました。大事なのはデータの量ではなく、常に新しいデータを生み出し続けるループ構造を作ることであり、「ループ・イズ・キング」の時代に突入したのです。
以上、115ページまで、まとめましたが、著者の渾身の作だと伝わったのではないでしょうか?
以下、僕の短文書評を載せます。
「「ダブルハーベスト」4点。AI戦略を最先端の知識で構築するなら、この本なくして作れないのでは?と感じた名著。もちろん、僕はAIの専門家ではなく、素人なのですが、素人でもAI戦略の肝が手に取るようにわかるあたり、相当、著者は実力者なのだなと感じる。大手だけでなく、中小企業の社長さんもAIを導入するつもりなら、一読を勧める。かなりお勧めの名著!!」以上、ここまで。
ではこの辺で。(4993文字)
このブログは個人的見解が多いですが、本・記事・YouTube動画などを元にしつつ、僕の感性も加えて、なるべく役立つ・正しいと思われる記事を書いています。
あくまで読者がさらに深く考えるきっかけとなればいいなぁという思いですので、その辺は了解ください。
参考・引用文献。
コメント