無窮 i ラボ Blog

知的ネット社会、知そのもの、機械との共生、プログラミングに関して。

 
 

2014年 8月17日、「Niihamaたん」の語彙を拡大する一連の仕組みの稼働を開始しました。

これまでは、メールマガジン記事などを元に語彙データを作成してきましたが、新しい この仕組みによって、ブログを元にした語彙データが追加されます。

メールマガジン記事は、最近、新しい記事が極めて少なくなり、私の表現の場はブログに移行しています。この仕組みによって、「Niihamaたん」は、新しい話題に対応した表現をするようになりました。

現在は、この仕組みを適用しているブログデータは限られていますが、水平展開をすることにより、より多くの語彙データを「Niihamaたん」は備えることになります。

これまで(8月16日)の語彙ファイル数: 4300
8月17日時点での語彙ファイル数: 5100
水平展開によって達せ得る語彙ファイル数: 9000

今回の仕組みを整備するにあたり、3個のプログラムを新作、1個のプログラムを変更しました。
スポンサーサイト
 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク
文末決定を「あやとり」にやらせるのは難しい。

仕組みの上では可能であるし、難しくない。

しかし、「あやとり」用の標準辞書が、文の意味において重要でない語句を消去する思想のもとに作られているため、処理にかけると消されてしまう。

 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク
連用句解析技術を実装しました。

7月15日に m00dx の改良を実施しました。(Ver.1.10β)

そして、本日 7月21日に、m00dx の実行、アップロード、cgi, JavaScript系の対応作業を行いました。

Niihamaたんの表現が豊かになることが期待されます。
 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク
「Niihamaシステム」mode-00では、「無窮ナレッジ」内のあるノードと、そのノードから短いリンク距離にあるノードのコンテンツから抽出した、自然言語句を組み合わせて文を作ります。

リンク距離の考慮により生じている、自然言語句の出典であるコンテンツ同士の関連性が、知性の根源です。
 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク
連用句解析の開発を開始しました。

現在の「Niihamaシステム」mode-00 は、「無窮ナレッジ」をコーパスとして、抽出した名詞句と文末句を組み合わせて文章を生成しています。

連用句解析の開発により、連用句を含む文章をつくることができ、表現の幅が広がります。

なお、連用句解析技術は、まず名詞句に含まれる連用句を取り除く目的で使われ、ブラッシュアップされる予定です。
 このエントリーをはてなブックマークする このエントリーを含むはてなブックマーク