Ivoryworks

Project STAPAIN - スタパさんの中のひと
<< 前のページ次のページ >>

スタパクラウドの巻

スタパクラウド

 学習(形態素の蓄積)を繰り返す事で、生成される文章の質の低下がみられるようになってきました。
 生成される文章の自由度(おもしろさ)高めるため、沢山の文章を学習させた結果、生成される文章のテーマがぼやけ、支離滅裂な文章が生まれるようになってしまいました(様々なテーマが詰め込まれた文章となっている)。

 解決策として、文章の生成時にあらかじめテーマを指定するようにしようと思います。

 文章生成のインターフェイスをタグクラウドにしてみようと思います。  まず、蓄積した形態素の中から名詞を対象としてタグクラウド化します。  そして、選択したタグが存在する元記事の形態素のみを利用して文章生成を行う事で、生成する文章にある程度のテーマを持たせる事ができます。あくまである程度。

 具体的に言うと、「デジカメ」のタグを選択(指定)して文章生成を行う場合、「デジカメ」という単語が登場した記事から分解した形態素(ややこしい・・・)を利用する事になるので、結果として「デジカメ」について多く語る文章が生成される事になります。

スタパクラウド

というものを作りました。

 スタパブログの全記事を学習しています(定期的にRSSを読み込んで自動学習するようになっています)。
 ある程度ですが、テーマに沿った文章が生成されています。
 選択したタグとは全く関係ない文章になる事もありますが、それは「おもしろさ」という事で。どうか。ひとつ。
 なお、タグクラウドに表示される単語は、単純に出現率だでけ構成しているわけではなく、ちょっと手を加えています。なので、そのタグが出現しない記事も利用される事があります。

<< 前のページ次のページ >>