我正在开发一个用户提交一系列问题的应用程序.这些问题是自由形式的文本,但基于特定的产品,因此我对上下文有一般性的了解.我有一个常见问题解答列表,我需要尝试将用户的问题与
我的语言是Delphi.我的一般思维方法是抛弃小的“垃圾词”,a,an,the,is,of,by等…对这些单词运行一个词干程序来获取根词,然后尝试匹配尽可能多的其余的话尽可能.
有更好的方法吗?我曾考虑过某种类型的自然语言处理,但我担心的是我会关注多年的发展,而不是一两周.
不确定这个解决方案是否正是您正在寻找的,但如果您想要解析自然语言,您可以使用Link-Grammar Parser.值得庆幸的是,我已经翻译了这个用于Delphi(带有演示),你可以下载(免费和100%开源)from this page on my blog.