スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

会話プログラム開発記(11):今後の開発方針

プロジェクトが一つの節目を迎えたので、今年の開発方針と優先順位を考えてみました。


1)辞書の発言内容の修正・追加
発言する文章の内容自体が陳腐だったり、分かりにくかったり、日本語的に変だったりする部分を修正しつつ辞書を追加。日常的に行っている作業なので面倒な時もあるが、これが一番大事。

2)発言する状況設定の調整・追加
正規表現で、的確なシーンで対応する発言を行う様に設定する。こちらも、修正、追加ともにノウハウを培いつつ継続。発言の精度を決める、とても重要な作業。

3)パラメータ設定
思い出し機能等の現状機能の設定の最適化。これだけで雰囲気がガラリと変わる。引き続き試行錯誤が必要。

4)新機能開発
より、人間らしい会話を行うための新機能の探求。思考実験と基礎技術研究が命。



地味で面倒でも、論理的に正しい事の継続が一番の近道なのは世の常。生き物育てる様なもんです。
考えがまとまったので、しばらくはこの流れで作業、作業。

コメントの投稿

非公開コメント

辞書型

まずは辞書ですね、私も同意見です。
これで辞書型の性能が決まると言っても過言じゃないと思います。
いま私が考えているのは二つ
①とにかくいろんなところ(インターネット)から一気にデーターを取り込み表計算ソフトで編集する
②形態解析を使ったソフトを作り自動学習させる
ただ②についてはすぐに出来るものでもないので現状は①でつくっていくしかありません
その他にも何か良いアイデアがあればいいんですが・・・情報交換の場がほしいですね。

自動学習

既存のwebコンテンツや会話ログから辞書を生成できれば学習機能は完成だと思うのですが、色々考えてみた結果

1)文体の整形
2)長文を要約する
3)マッチング用キーワード抽出

を行った上で、辞書形式への変換プログラムを書くという事になりそうなので、自動で文章を作成する事自体が正攻法では個人レベルを超えていますね…

1)と2)をまともにやろうとすると、形態素解析した後に「日本語の意味を理解して修正する」プログラムを開発しないと、巷のとんちんかんな事を言う自動学習型と同じになってしまうと思います。

私も色々と調べたのですが、専門機関の研究ですら下の様なレベルなので、個人ではムリっぽいかもしれません…
http://www.gengokk.co.jp/koubun/

トモックさんも同じ様な事を試行錯誤されていると思いますが、現状でベストを尽くすなら回り回って人間が辞書を書く事が一番クオリティを上げられる様ですね。


かといってあきらめた訳では無いので、何か可能性のありそうな情報があれば私とトモックさんだけでも協力して進めてみましょう。
プロフィール

hak

Author:hak

会話プログラムALAINの開発日誌と会話ログ。ALAINとの会話はどなたでもお気軽にどうぞ。相手はプログラムなので、寛容に接して楽しんで頂けると幸いです。

近況報告
 
リンク
最新記事
カテゴリ
月別アーカイブ
検索フォーム
RSSリンクの表示
QRコード
QRコード








上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。