技术开发 频道

Marvin Elder访谈:语义学和关系数据库理论二者合璧

【IT168技术分析评论】
    今天做客的是Semantra公司的奠基人,也是该公司R&D的副主席Marvin Elder先生。Semantra是一家专注于将自然语言和语义学应用于数据库的一家公司。 
    主持人:什么是 “会话式分析学(conversational analytics)”? 
    ME: 会话式分析学是一种方法,这种方法能让非技术终端用户用他们熟悉的商业术语,通过普通的话语请求就能从数据库获得需要的信息。
 
    要想获得技术含量更高更精准的答案,需要明确在自然语言处理(NLP)领域中会话式分析学所处的地位。为了说明这个观点,将自然语言处理(NLP)分解成各部分来研究,最后就会落脚到研究会话式分析学。从更广阔的认知上看,历来自然语言处理(NLP)与结构化查询查询联系在一起,它不适用于非结构化数据:文档、电子邮件、RSS等。“语义学”是自然语言处理(NLP)的一个新兴的学科,是计算语言学和概念实体论的联姻。
 
    自然语言数据库查询(NLDQ)是自然语言处理(NLP)的子领域,处理自然语言查询。自然语言数据库查询(NLDQ)本质特点就是将自然语言请求转化为SQL或者一些其他数据库查询语言。因此,语义学和关系数据库理论和并在一起,二者合璧,分析语境的请求,将一些形成的概念转化为目前使用成熟的数据库查询,将准确的信息返回给用户。 

    许多分析员总想将自然语言数据库查询(NLDQ)和“特别的BI工具”等同起来,但是我们不相信有一个工具这么“特别”,除非有一个具有数据库头脑的分析师来辅助。让特别的BI工具变得有用,那么准非技术终端用户必须能够得到自己的报表和图表,而不需要借助于IT人士。很遗憾,普通用户缺少推理能力的现实阻止了这种工具服务于商业的推广。
 
    会话式语义分析学要胜过特别的BI工具,因为它可以给用户输送“可控信息”,这些用户想要或需要基于既定的事情做出商业决策。用户考虑这么一个查询问题:“在休斯敦有哪个批发商的门市部,截至3/31/08营业收入额达$100,000?”这个时候数据库系统就要有重新定义商业行话和缩语的能力,处理非技术用户和企业数据之间的真实会话。这个能力正是Semantra软件的开发目标。 

    主持人:因此你的产品实际上是服务于自然语言数据库查询,而不是非结构数据的自然语言处理。既然这么些年来进行了许多次的尝试,过去的研究对于现在的成功有哪些帮助?出现了更好的算法? 

    ME: 当然有帮助!在探寻对话式分析突破口的道路上,Semantra公司坚信有更好的算法,将语义学、关系导航和用户会话成功的融合,产生新的技术,这种新的技术会消除与现存查询产品兼容的复杂度。
0
相关文章