IT168首页 | 产品报价 | 渠道168 | ChinaUnix社区 | ITPUB社区 | OA维修站 | 文库 | 博客 | 会议 | 自测 | 专题 | 订阅 | IT选型顾问
技术开发频道

数据挖掘

最近两年, 有一些行业趋势在非常明显,用关键词来总结就是:大数据、OTT、多屏互动。大数据是从互联网和IT领域发展起来的一个专业术语,它存在于各个领域、各行各业;而“OTT”、“多屏互动”是广电行业的专业术语,但它们和大数据有关,和广大受众的媒体体验更是密切相

24日更新
国双续扬:大数据时代的新媒体发展

刚刚过去的2012年,秦予有个很大的遗憾,就是没能招聘到自己想要的数据科学家,浪费了公司给的招人名额。他是支付宝用户价值创新中心的负责人。这个中心是支付宝大数据业务的核心部门。阿里巴巴2012年的进人指标只有200个,具体到支付宝公司,基本是只出不进,只有秦予

15日更新
南方周末:阿里巴巴的大数据梦

日前,发现一篇很有意思的文章,《What Do Statisticians Do At Google?》 作者是Michael Hochster,其本身就是定量分析师(Quantitative Analyst),在谷歌搜索和广告部门都工作过。现在就职于谷歌广告

04日更新
2013年谷歌的数据科学家都将干什么?

近日,Teradata 天睿公司大中华区Aster事业部总监孔宇华在采访中告诉记者,产品关联分析还对超市中产品的摆放、促销活动、采购产品都有非常大的用途,而美国大型连锁超市SuperValue通过部署Teradata Aster,可以分析过去8年产生的海量数据

22日更新
标签:大数据
激活数据 Teradata大数据分析瑞士军刀

本文出自阿里巴巴数据库技术团队的微博,主要对数据挖掘业务在MySQL数据库上拉数据慢的问题进行分析和解决。

12日更新
标签:dw MySQL
DW业务在MySQL上dump数据缓慢问题解决

从2007年到2011年,Facebook的大数据处理架构是如何演变的?在一个变动异常频繁,并且快速增长的环境里,都要面临哪些挑战?Facebook使用了一些组件和技术,让公司大部分部门都可以根据不同的目的访问、分析、使用数据,背后的驱动力是什么?

11日更新
Facebook的海量数据架构演变过程

三种社交网络每天都会产生大量的用户数据(UGC,User Generated Content),并且具有空前的规模性和群体性,吸引着无数研究者从无序的数据中发掘有价值的信息。这就像概率统计中经常举的投硬币算其正反面概率的例子,从几次的投掷结果中很难看到规律,但

18日更新
社交网络:数据科学家眼中的金矿

对于SQL开发人员来说,必须先要了解进行SQL编程的对象类型,即要开发的数据库应用是哪种类型。一般来说,可将数据库的应用类型分为OLTP(OnLine Transaction Processing ,联机事务处理)和OLAP(OnLine Analysis P

05日更新
数据库应用类型:OLTP与OLAP的比较

Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发。那么Spark和Hadoop有什么不同呢?1,Spark的中间数据放到内存中,对于迭代运算效率比较高。2,Spark比Hadoop更通用。3,容错性。4,关于Spark和Hadoop

01日更新
Spark与Hadoop计算模型的比较分析

如果能够从海量用户中通过自动手段挖掘出一个个的兴趣圈子,对于很多具体应用来说是非常重要的基础数据,比如可以利用用户所属兴趣圈子进行感兴趣人物推荐,或者根据所属圈子的群体特性分析用户的个人兴趣点等,所以在SNS平台下,如何对海量数据自动进行兴趣圈子挖掘是个非常有

21日更新
大数据分析:新浪微博兴趣圈自动挖掘

大数据的时代已然来临。IDC数据显示,在2006年全世界的电子数据存储量为18万PB,而如今这个数字已经达到180万PB,短短5年间就已经增长了一个数量级。而根据预测,2015年这个数字则会达到如同天文数字般的800万PB。

大数据引领创新机遇 引领未来巨大商机

处理大数据惯常是属于商业智能(BI)的事情。抽取数据、挖掘数据,制成报表、OLAP、仪表盘、挖掘模型,作为辅助决策之用。不过在BI领域都不这么叫法,大伙儿都说海量数据,Large-scale Data。这听起来还是略显学术气,不如Big Data来的通俗——大

海量数据席卷而来 管理数据是关键

9月20日消息,Teradata天睿公司大中华区CEO辛儿伦先生在北京主持召开了媒体见面会,详细介绍了Teradata天睿公司今年上半年相取得的成绩、在技术及服务层面近期收获的成果,以及透析了产业趋势。

大数据来临 Teradata天睿公司发力国内

4月7日消息,国内数据库领域唯一的年度盛会,由盛拓传媒IT168网站汇集旗下ITPUB、IXPUB以及ChinaUnix中国三大企业级技术社区优势资源主办的“2011数据库技术大会”,将于4月15日至16日在北京举行。在本届数据库技术大会中,众多数据库领域资深

2011数据库大会开幕在即 各路高手云集

C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的

26日更新
数据挖掘领域十大经典算法初探

最新一期英国《经济学人》杂志印刷版撰文称,阿里巴巴手中掌握着中国中产阶级的大量购物数据,可以借此开展更多业务,另外一个有潜力的领域是信贷。阿里巴巴已经成为了中国电子商务之王。

04日更新
电子商务之王马云的秘密武器:数据挖掘

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,

14日更新
细数数据挖掘的五个超赞免费开源软件

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化....

13日更新
细数5大免费开源的数据挖掘软件

Darwin被认为是主要的数据挖掘工具之一。这与它的名声相称。最近,Oracle从Thinking Machine公司获得了Darwln以增强它的产品提供的功能—哨别是在数据

21日更新
数据挖掘之Darwin(Oracle)

Hyperion Essbase OLAP server软件平台专为支援积各种分析应用程式而设计。它拥有先进的网上分析处理(OLAP)技术,可根据产品、客户、地域、时限等等各

21日更新
Hyperion Essbase OLAP server特性介绍
最新文章