文字サイズ
    各界で活躍する著名人に影響を与えた「1冊」に迫ります。

    人工知能で東大合格をめざす 新井紀子さん(52)(1)

    ビッグデータが集まらない!?

     まず、両方とも文全体が疑問文になっていない。また、「出てくる」を両方とも「come out to」と誤訳しており、元の日本語がまずかったかと反省したほどだ。冠詞や固有名詞、その他の動詞の使い方にもそれぞれ問題点がある。

     なかでも致命的なのが、「Yahoo!翻訳」では人類の存亡の危機をもたらす主語が「あなた」になっていること。「Google翻訳」は後段の部分が支離滅裂だ。

     簡単な文章なら割と正解するのだが、少し複雑になると、途端に誤訳し始める。それぞれ一長一短あるものの、これらを使って英語の宿題をやると、間違いなく減点される。

     ビッグデータの限界については、新井の話がさらに続く。

     「たとえば『危機』の時……子供が車の前に飛び出してきて『ワッ!』と叫んだり、車外に見える土手から落石しそうだったり、車の中に変なニオイがしてきたとか……。こうしたカーナビが想定していない物は、ビッグデータの中にもめったにはない。そういう時に発する『あっ!!』というのは何が『あっ!!』なのか(コンピュータには)分からない。『あっ、危ない』と言った時、何が危ないのかも分からない。まあ、(声を発した人の)視線の先を見ると、石があるけれど、その石がなぜ危ないのか、人工知能なら分からなくてはならないわけですね。石がゆらゆらしているとか、土砂から水が流れているとかが分かって初めて、土砂崩れするかもしれないと思う。でも、それって物理ですよね」

     つまり、石があって水が流れていれば、土砂崩れの蓋然性が高いと判断する。あの石が落ちてきたら軌道はこうなるだろうから、それを避けて車を止めなくてはいけないということだ。

     「それは分類問題では解けないんですよ。女性同士のおしゃべりや緊急時の会話などになると、ビッグデータがそもそも集まらない。問題解決を求められている分野の中で、ビッグデータが集まらない分野の方が圧倒的に多いんです。自然言語の理解というのは、そういうこと。ビッグデータが集まらないので、機械学習ができないんですよ」

     では、逆にビッグデータの応用分野はどんなところなのだろう。世の中では最近、猫も杓子も「ビッグデータ」と騒いでいるが……。

     「機械学習っていつでも使えるわけではなくて、同じタイプの大量のデータがないと無理なんです。たとえば、(写真をほぼ無制限に保存できる無料のサービスの)『Google Photo』のように画像がたくさん集まっているとか、監視カメラのように同じ場所を写し続けている状態があって、『この人』を探すというのはできる。また、電子カルテが毎日集まっている病院で、いろんな(疾患にまつわる)キーワードが出てきて、検査結果があると、こういう疾患を疑ってよいと推定することはできる。しかし、そのことがシンギュラリティとか、(コンピュータが物事や言葉の)概念を獲得するといったことにはならないんです」

     次回は、なんと「オレオレ詐欺」みたいだという人工知能のサービスと人間側の受け止め方、人工知能研究を牽引(けんいん)する米国の現状、日米の戦略の違いを聞く。

     (敬称略、文:メディア局編集部 小川祐二朗、写真:高梨義之)

     

    ■新井紀子プロフィル

     東京生まれ。一橋大学法学部卒。イリノイ大学数学科博士課程修了。理学博士。2005年より学校向け情報共有基盤システムNetCommonsをオープンソースとして公開。全国の学校のホームページやグループウェアとして活用されている。11年から人工知能分野のグランドチャレンジ「ロボットは東大に入れるか」のプロジェクトディレクターを務める。ナイスステップな研究者、科学技術分野の文部科学大臣表彰などを受賞。著書に「数学にときめく」(講談社ブルーバックス)、「コンピュータが仕事を奪う」(日本経済新聞出版社)、「ロボットは東大に入れるか」(イースト・プレス)など多数。

     

     

     

     

    2015年08月10日 05時20分 Copyright © The Yomiuri Shimbun
    大手町モールのおすすめ
    帆布鞄
    PR情報
    大手町モール
    ブランディア
    アーカイブ