WITH

人間が文章を書かない時代が到来する!?【日本語特化AIエンジン・ELYZAがもたらす未来とは その1】

非常に速いスピードで進歩するAI技術。自然言語処理における文章理解精度については、すでに人間の能力を超えているそう。ビジネス現場への実装も着実に進んでおり、今後は人間が文章を書く必要がない時代の到来を予感させている。

そこで今回、堀江貴文氏は、 株式会社イライザ代表取締役CEO・曽根岡侑也氏から、現段階での自然言語処理レベルや応用事例、今後の展望について話を聞いた。

現段階でのAIの自然言語処理レベルとは?

曽根岡侑也(以下、曽根岡) 私は東京大学の松尾豊(人工知能研究の第一人者)研究室の職員として、大手企業の人工知能(AI)プロジェクトマネージャーを担当し、そこからスピンアウト(独立)する形で「ELYZA(イライザ)」という会社を立ち上げました。ですから、ELYZAは“AIの会社”です。また、AIといっても画像、映像、音声、文字、ロボットなどさまざまなジャンルがある中で、私たちは“自然言語処理(人間が日常的に使っている言葉をコンピュータで処理すること)”と“リテールテック(小売にデジタル技術を導入すること)”を中心にやっています。

堀江貴文(以下、堀江) なるほど。

曽根岡 今は特に自然言語処理に力を入れていて、国内最大級の日本語特化AIエンジン「ELYZA Brain(イライザブレイン)」を開発しました。

堀江 日本語に特化したのは、何か意味があるんですか?

曽根岡 あります。ただ、その前に英語の自然言語処理の状況について簡単に説明させてください。まず、人間が文章を理解する精度は87.1といわれています(英語圏における総合的な言能力のスコア)。2018年10月に「BERT(バート)」と呼ばれるAIによる自然言語処理の技術ができましたが、 BERTができる前のAIの文章を理解する精度は、良くて70(ELMo)程度で、ここには17以上の大きな差がありました。しかし、BERTが開発されると、その精度は80.2でかなり人間に近づきました。

堀江 へー。

曽根岡 その後、2019年6月に「XLNet」が人間の精度を超える88.4を記録し、2019年10月には「T5」が90.3を出しました。すでにAIの英語を理解する精度は、人間を超えています。そこで、先ほどの「日本語でやる意味はなんですか」という質問にお答えしますと、英語の自然言語処理技術はこのような状況なのに、日本語はBERTと同じ精度を出すモデルがありませんでした。それで「それなら我々でBERTの技術を再現実装する日本語モデルをつくろうよ」ということになったわけです。

堀江 自然言語処理モデルを作るときに、英語と日本語で何か大きな違いはあるんですか?

曽根岡 特に大きな違いはありません。

堀江 今、ELYZAの精度は何%くらいなんですか?

曽根岡 ELYZAの日本語の文章理解の精度は83.0%です。人間の精度は80.6%です。

堀江 人間を超えてますね。

曽根岡 そうです。

堀江 すごいな。

この続きは『WISS』で全文ご覧いただけます。購読はコチラ

その2へ続く

曽根岡侑也

株式会社イライザ代表取締役CEO。1990年、東京都生まれ。2013年に東京大学工学部卒業し、2017年、東京大学大学院工学系研究科修士課程修了。2018年に「株式会社イライザ」を設立。2020年には、株式会社松尾研究所取締役に就任。