| << 前のページ | 次のページ >> |
スタパさん的アウトプットという事なんですが、まずは何かスタパさんが書かれるような文章が生み出せれば良いかな、と。
スタパさん的文章へのアプローチとして、人工無能でも利用されている形態素解析とマルコフ連鎖を用いようと思います。
形態要素解析とは、自然言語処理の基礎技術のひとつとされ、文章を形態素と定義される最小単位に分解し、それぞれの品詞を判別する作業を指します。
例示したほうが判りやすいですね。 ■解析前 白い猫と黒い犬 ■解析後 白い (形容詞,自立) / 猫 (名詞,一般) / と (助詞,並立助詞) / 黒い (形容詞,自立) / 犬 (名詞,一般)
マルコフ連鎖とは、
なんて偉そうに初めてしまいましたが、私は良く理解していません。
以降、本プロジェクトで用いる範囲でのマルコフ連鎖について記載します。
本プロジェクトは「文章を生み出す」事を主題としています。ただ、無の状態から文を生み出すのは非常に困難(不可能?)なので、蓄積した情報を元に新しい文章を生み出そうと思います。
マルコフ連鎖は、現在の挙動によって未来を決定し、未来の挙動は過去の挙動の影響を受けないという事なのですが、形態素解析で例示した「白い猫と黒い犬」を形態素解析し蓄積したとすると、「白い」の後には「猫」が続き、「猫」の後には「と」が続く事が定決定されます。
「白い猫と黒い犬」は非常に短い文なので、マルコフ連鎖を説明するには少し判りにくいかもしれません。
次の例を見てください。
僕はリンゴとバナナを食べた。君はチキンとサラダを食べた。
この文章を形態素解析し蓄積したとします。
「僕」の後に続くものは「は」のみですが、「は」の後には「僕は」の「リンゴ」または「君は」の「チキン」が続く可能性があると考えられます。
よって、蓄積した情報から「僕はチキンとバナナを食べた」という文章を生み出す事ができます。
ちなみに、「サラダ」は「と」の後にしか出現していないため、「僕はサラダとリンゴを食べた」という文章が生まれる事はありません。
これが基本的な考え方です。
| << 前のページ | 次のページ >> |