主持人:下面是第二个议题和第三个议题的探讨,都是管理数据管理自动化的探讨和数据挖掘的探讨。下面大家可以自由讨论。提问之前,大家要介绍一下自己所处的公司和行业。比如关注医疗行业,关注不同行业的也会有一些不同的问题。
因为很多厂商都提到了医药这个行业,下面有请海虹制药公司的工作人员。
与会嘉宾热烈讨论
海虹制药:我们这个行业,并不是跟医药、医疗很像。其实我们跟淘宝是比较像的。我们也是一个网上交易的平台,也包含B2C的平台,我们也是自己控制需求,等于自己在生产产品,自己在用。当然也是各个医院通过网上采购,网上交易去构建中间的平台。通过给厂商、医院构建中间的交易平台,当然也给政府提供这种监管、定价,做这种依据,建立这样一个平台。并不是说像刚才大家介绍的医疗行业的。我们更像电子商务性质的。
我想问一下,这种核心的观念性的内容执行频率很大,要求很高,你们要求几十个甚至很多的逻辑问题,需要很大的内容。这时候你们不通过优化稳定性的方式去做吗?
淘宝网:数据库优化是综合的过程。别不是说我们很死板的改写逻辑内容。我们做数据库的,做到最后,就像打太极拳一样。我们做数据库的时候,每个语句的时候,这个语句该怎么优化,肯定有很多的方法。我们一个最重要的原则,就是让逻辑执行的层面达到最小。
海虹制药:说到优化,我想简单说一下,大家现在更关注的就是优化给我们带来的效果。还有一个,大家应该注意一下,当优化不当的时候,给我们带来什么灾难,大家有没有一些什么心得,如何避免这些情况。像刚才的冯先生也提到了,添加、删除作用大家都很清楚,简单的增加索引,或者说对这种统一信息的收集,很可能使我的目标达到效果,但是可能会导致其他关键性的性能下降,我怎么来把它找到,或者杜绝这种情况发生?
淘宝:我们对照生产环境,会有相应的测试环境。大部分情况下,我们的语句、应用测试环境下,压力测试等等,你要做缩影还是什么,都要在到测试环境测试一下。而且你刚才说的穿越索引的词库,新的索引没有统一的信息,这个情况下也有一些弥足的方案,甚至是你创建的时候会把统一信息一起收集起来。整个方案,就是你一定要多多测试,多想到一些可能存在的问题。
郭志勇:您说的叠加一些混合负载的东西,这时候我一个库里面的信息或者索引不能够满足所有的应用,这时候可能对于你某种ORIT的应用,也可以采用强制索引,不一定用优化器制定它可以吧?
海虹制药:我讲这个索引,达到我的新目的了。
张军华:这个地方你应该信任数据库长方开发的新技术。
海虹制药:测试环境确实很重要,但是测试环境不可能完全一样。数据分布很难保证完全一致。
张乐奕:任何修改都是有风险的。
淘宝:不能保证百分之百,但是能保证百分之九十九点九几。这个就可以了。
易贝:我们创建的时候会跟踪这个东西到底有什么变化。我们把它前后几天或者几个星期的信息全部查出来,看看如果有不合理增加的话,会知道这种情况下产生的影响。