Ivoryworks

Project STAPAIN - スタパさんの中のひと
<< 前のページ次のページ >>

マルコフ連鎖でスタパさんの巻 その2

マルコフ連鎖による二階の近似での文章生成

 マルコフ連鎖の一階の近似では散々たる結果でしたが、気を取り直して行きたいと思います。今回は二階の近似です。
 一階の近似に引き続き、同じサンプル(スタパブログ 2006/01/23の記事)を用います。

 マルコフ連鎖の一階の近似では、単純に語を並べただけでしたが、二階の近似では語と語の連続性に着目して文章生成を行っていきます。

 二階の近似は、語(形態素)の繋がりを考慮します。
 以前例示した「僕はリンゴとバナナを食べた。君はチキンとサラダを食べた。」という文章を用いて考えてみます。
 この文章は以下の繋がりで構成されています。

接頭辞接尾辞
リンゴ
リンゴ
バナナ
バナナ
食べた
食べた
 :(省略)
食べた
(文章の終わり)

 仮に、始めの形態素を「僕」とします。「僕」に続く形態素の候補は「は」しかありません。そこで、「僕」に続く形態素「は」を選択し、「僕は」という文章の始まりが生まれます。
 次に、「は」に続く形態素は「リンゴ」と「チキン」です。この2つが候補になり、候補の中からランダムに形態素を選択します。「チキン」を選んだとしましょう。ここまでで「僕はチキン」となります。
 この作業を繰り返す事により、意味の通る文章生成に少し近づく事ができます。

 早速、サンプルを用いて二階の近似による文章を生成してみましょう。今回も、改行にたどり着いたら文章の終わりとします。

 これ、500万画素のダ! ちなみに、楽勝でふたつのダ! これ、超広角も撮れるってコトなフィーリング。それぞれのレンズでふたつのニュースをまとめ上げた拙者。それぞれの、画角等を使わず、500万画素の、縦位置で23mm、外観も撮れている。もうすぐ発売だ。あと、なんか、このデジカメをまとめ上げたような。

 一階の近似による文章に比べ、かなりまともな文章を生成する事ができました。
 ふたつのニュースをまとめ上げたり、デジカメをまとめ上げてるっていうか、よく見たらデジカメの方は「ような」って書いてあるから実際にはまとめ上げてないのカ!!
 いや、でも良いです。

 前にも書いたとおり、形態素の選択はランダムに行うので、生成の度に文章は異なります。

 個人的に興味津々モード。……V570に興味津々モード。もうすぐ発売だしてくるようなの中に2台のCCDがし、今後けっこーこのタイプが出てみようかなと思っている。あと、考えれば考えるほどV570にする機能、考えれば考えるほどV570にする機能、なんてのズームレンズを読んである。もちろん全部単焦点レンズを読んで同時に撮ってみようかなとプチ感動して。

 ちなみに上記2例は、何度か文章生成を試行し、割とまともそうなものを採用しています。
 一階の近似に比べ、質の良い文章が生成できるようになったとは言え、めちゃくちゃな文章も多く生成されます。

 個人的に無理なフィーリング。……V570にする機能、28mm、考えれば、2セット搭載してくるようなんですよね! これ、広角マニア用デジカメな。

 個人的に無理なフィーリング
 元の文章には存在しない語の並びだが、スタパさんがどこかで書きそうなフィーリング。

<< 前のページ次のページ >>