| << 前のページ | 次のページ >> |
マルコフ連鎖の一階の近似では散々たる結果でしたが、気を取り直して行きたいと思います。今回は二階の近似です。
一階の近似に引き続き、同じサンプル(スタパブログ 2006/01/23の記事)を用います。
マルコフ連鎖の一階の近似では、単純に語を並べただけでしたが、二階の近似では語と語の連続性に着目して文章生成を行っていきます。
二階の近似は、語(形態素)の繋がりを考慮します。
以前例示した「僕はリンゴとバナナを食べた。君はチキンとサラダを食べた。」という文章を用いて考えてみます。
この文章は以下の繋がりで構成されています。
| 接頭辞 | 接尾辞 |
| 僕 | は |
| は | リンゴ |
| リンゴ | と |
| と | バナナ |
| バナナ | を |
| を | 食べた |
| 食べた | 。 |
| 。 | 君 |
| :(省略) | |
| 食べた | 。 |
| 。 | (文章の終わり) |
仮に、始めの形態素を「僕」とします。「僕」に続く形態素の候補は「は」しかありません。そこで、「僕」に続く形態素「は」を選択し、「僕は」という文章の始まりが生まれます。
次に、「は」に続く形態素は「リンゴ」と「チキン」です。この2つが候補になり、候補の中からランダムに形態素を選択します。「チキン」を選んだとしましょう。ここまでで「僕はチキン」となります。
この作業を繰り返す事により、意味の通る文章生成に少し近づく事ができます。
早速、サンプルを用いて二階の近似による文章を生成してみましょう。今回も、改行にたどり着いたら文章の終わりとします。
一階の近似による文章に比べ、かなりまともな文章を生成する事ができました。
ふたつのニュースをまとめ上げたり、デジカメをまとめ上げてるっていうか、よく見たらデジカメの方は「ような」って書いてあるから実際にはまとめ上げてないのカ!!
いや、でも良いです。
前にも書いたとおり、形態素の選択はランダムに行うので、生成の度に文章は異なります。
ちなみに上記2例は、何度か文章生成を試行し、割とまともそうなものを採用しています。
一階の近似に比べ、質の良い文章が生成できるようになったとは言え、めちゃくちゃな文章も多く生成されます。
個人的に無理なフィーリング
元の文章には存在しない語の並びだが、スタパさんがどこかで書きそうなフィーリング。
| << 前のページ | 次のページ >> |