-
[数据仓库] 像淘宝 、京东商城、腾讯、360,每天海量的数据,他们的数据仓库用的什么数据库,如何存储的,运行每天的作业也是个挑战?
像淘宝、京东商城、腾讯、360,每天海量的数据,他们的数据仓库用的什么数据库,怎么存储的,运行每天的作业也是个挑战???像淘宝、京东商城、腾讯、360,每天海量的数据,他们的数据仓库用的什么数据库,怎么存储的,运行每天的作业也是个挑战???------解决方案--------------------...
145
热度 -
163
热度 -
[数据仓库] 小弟我想学习数据仓库和数据挖掘,请大家给小弟我推荐一本书
我想学习数据仓库和数据挖掘,请大家给我推荐一本书我想学习数据仓库和数据挖掘,请大家给我推荐一本书------解决方案--------------------如果是一本书呢,我推荐:《数据挖掘概念与技术》原书名:DataMining:ConceptsandTechniques原出版社:Morganka...
150
热度 -
[数据仓库] 数据库和数据挖掘的关系,该怎么解决
数据库和数据挖掘的关系各位大侠们,我刚接触数据库,我想知道数据库和数据挖掘的关系,有哪些联系和区别。我现在从事数据库工作,目前就是数据整理,我想学习数据挖掘,该怎么学习。------解决方案--------------------db是软件相关,datamining是研究算法。
225
热度 -
[数据仓库] 大型项目用分布式数据库解决吗?该如何解决
大型项目用分布式数据库解决吗?像移动网上营业厅那种大型项目用分布式数据库解决吗?大家知道如果只有一个数据库服务器,那这台服务器的磁盘空间是不够的存储大量数据的,如果项目跨地区的项目,那更是要多个数据库(当然,如果各地间数据库关联不大,可以用WebService来解决)如果是跨地区的社区网站可以用No...
140
热度 -
[数据仓库] 空间数据挖掘(Spatial Data MIning)跟多媒体数据挖掘(Multimedia Data Mining)
空间数据挖掘(SpatialDataMIning)和多媒体数据挖掘(MultimediaDataMining)空间数据挖掘是数据挖掘的一个分支,是在空间数据库的基础上,利用各种技术,从大量的空间数据中自动挖掘事先未知的且潜在有用知识,提取非显式存在的空间关系或其他有意义的模式等。用来理解或重组空间数...
210
热度 -
203
热度 -
[数据仓库] 数据挖掘简略快速方法
数据挖掘简单快速方法估计上csdn找资料的也不会搞的太深,所以我这套入门级的方法应该够用了。很简单方便。用spoon搞定一切(基于kettle)。spoon的文档比较恶心。好多东西得自己去摸索。Perspective实际上把spoon分成了不同的3个软件,做预提取用第一个,做分析用第二个(Model...
141
热度 -
[数据仓库] ODI 实施到Insert flow into I$ table步骤报错
ODI执行到InsertflowintoI$table步骤报错先贴错误:12154:66000:java.sql.SQLException:ORA-12154:TNS:无法解析指定的连接标识符java.sql.SQLException:ORA-12154:TNS:无法解析指定的连接标识符atorac...
401
热度 -
[数据仓库] 数据挖掘的数据合股源
数据挖掘的数据集资源?来自互联网:1、气候监测数据集http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~rowe...
281
热度 -
[数据仓库] 数据挖掘归类及常用算法
数据挖掘分类及常用算法基于学习策略的分类机械学习传授学习类比学习归纳学习基于解释的学习基于学习方式的分类(1)有导师学习(监督学习):输入数据中有导师信号,以概率函数、代数函数或人工神经网络为基函数模型,采用迭代计算方法,学习结果为函数。(2)无导师学习(非监督学习):输入数据中无导师信号,采用聚类...
135
热度 -
[数据仓库] 数据挖掘开掘什么类型的模式
数据挖掘挖掘什么类型的模式数据挖掘功能用于指定数据挖掘任务中要找的模式类型,一般的,数据挖掘任务可以分两类:描述和预测。描述性挖掘任务刻划数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断,以进行预测。
147
热度 -
[数据仓库] Sybase正式公布数据仓库产品Sybase IQ 15.0
Sybase正式发布数据仓库产品SybaseIQ15.0原文:19March2009<<WorkflowandBPMBusinessIntelligence>>SybasereleasesIQ15BYTHEOBOSHOFF,ITWEBSENIORJOURNALIST.[Joh...
154
热度 -
229
热度 -
[数据仓库] 全文检索、数据挖掘、推荐发动机系列-去除停止词添加同义词
全文检索、数据挖掘、推荐引擎系列---去除停止词添加同义词转自:http://www.cnblogs.com/yantao7589/archive/2011/08/19/2145991.html?Lucene对文本解析是作为全文索引及全文检索的预处理形式出现的,因此在一般的Lucene文档中,这一部...
206
热度 -
147
热度 -
[数据仓库] 云年代的企业应用数据挖掘
云时代的企业应用数据挖掘随着云时代的到来和SaaS概念的引入,越来越多的企业开始选择由SaaS应用提供商、运营商等通过互联网平台提供SaaS应用服务,SaaS应用的数据量面临着TB级的增长速度;不同的SaaS应用体系,提供的数据结构也不完全相同,数据有文本、图形甚至小型数据库;SaaS应用数据随着云...
129
热度 -
[数据仓库] 数据挖掘:用户推荐系统技术深度揭底
数据挖掘:用户推荐系统技术深度揭秘数据科学家需要具备专业领域知识并研究相应的算法以分析对应的问题,而数据挖掘是其必须掌握的重要技术。以帮助创建推动业务发展的相应大数据产品和大数据解决方案。EMC最近的一项调查也证实了这点。调查结果显示83%的人认为大数据浪潮所催生的新技术增加了数据科学家的需求。本文...
270
热度 -
[数据仓库] 数据仓库缓慢变更维的三种方式
数据仓库缓慢变化维的三种方式?SlowlyChangingDimension简称SCD是数据仓库建模和处理过程中一个很重要的概念,因为数据仓库系统的主要功能是对历史数据进行汇总和分析,所以保存历史记录的变化是很重要的。SCD是用来处理Dimension表变化的一种设计理论。SCD通常使用三种类型:类...
401
热度 -
[数据仓库] 【转载】ETL构建企业级数据仓库5步法
【转载】ETL构建企业级数据仓库五步法一、什么是?ETL??????ETLETL是数据抽取(EXTRACT)、转换(TRANSFORM)、加载(LOAD?)的简写,它是将OLTP系统中的数据经过抽取,并将不同数据源的数据进行转换、整合,得出一致性的数据,然后加载到?数据仓库中。简而言之ETL是完成从...
286
热度