previous arrow
next arrow
Slider

AIのテキス卜データの活用の可能性

AI・ディープラーニングの将来性や発展性について、「テキストデータ」の活用という方面でQ&A形式でまとめてみました。
Q:テキストデータでいうと、どんなものがありますか?
A:テキストデータを利用したAIの応用というと、やはりいちばん実用的なのは翻訳だと思います。大手検索サイトの翻訳機能も最近、すごく精度が上がってきてると聞きました。
Q:テキス卜だと、「AIが人に代わって書く」 というのも話題になりましたね。新間社や通信社がAIで記事を制作しているとか、聞いてますけどどうなんですか?
A:文章のサマライズ(要約)なら得意ですね。たとえば企業の決算公告などは、ある程度、定型化されているので、必要情報を入れれば、そのまま自動的に記事を書いてくれそうですね。ただ、そのへんはAIというよりも、RPAに近いかなという人もいます。
Q: RPA?
A: RPA (Robotic Process Automation) といって、定型化された枠の中に、決められた方法でデータを埋め込んで自動処理する方法です。テキストデータの場合だと、決められた枠の中に、文字を自動的に流し込んでいくイメージです。たとえば、「◆=社名、●=年度、▲=利益、★=数値」と決めておいて、「◆の●年度の▲は★だった」の形をつくり、後からその形に沿ったテキス卜を流し込めば、自動的に文章ができあがる、というものです。
Q:あんまりAIっぽくないですね。ディープラーニングで文章化はできていない、ってことですか?
A:そうではなく、ディープラーニングで文章を書くことは、すでに始まっているそうです。、文章のサマライズ(要約)がそうですね。データを流して、そこからどの文章をつなぎ込むか。日本語はまだ難しいようですが、英語のレベルは結構進んでいるとの話です。
Q:定型文書だけということですか?
A:いいえ。英語なら、定型文には限らず、例えば大手検索サイトでは、ニュースのサマライズなら、コンビュータが自動で書くんですって。文芸の分野でも、ショートショートを書くプロジェク卜もあると聞いたことがあります。
Q:たとえばどんな?
A:有名人のショートショートを分析して、AIでショートショートを創り出そうというプロジェクトもあるそうです。2012年から始まって、2016年にはAIで書いたショートショートがある賞の一次審査に通ったとか聞きました。「きちんとした内容になっている」と評価されたそうです。
Q:ディープラーニングって、データがあればあるほど精度が上がるんですよね、「フレーム問題」みたいに、データにキリがない場合は別として。
A:そうともいえません。ゲノムデータのようにデータが大量にありすぎる場合は、最初の「アタリ」をつけるためにディープラーニングを使うこともあるからです。たとえば新薬づくりで、もし、全パターンを計算していたら膨大な計算量になってしまうので、まずは、「この辺かなあ」とアタリをつけるそうです。碁や将棋の世界でのAIソフトも同様らしいです。
Q:そのとき、ディープラ一二ングを使う?
A:そう。ディープラーニングでいったんアタリをつけたら、後はその部分だけを計算させるそうです。その後の計算は、ふつうにモンテカルロ木探索とかでシミュレーションしていくだけ。膨大すぎるデータを扱う場合、「この辺がポイントかな」というのを見つける手法としても、ディープラーニングが使えそうですね。

Leave a Comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です