-
[数据仓库] ETL增量数据抽取的原理,该如何处理
ETL增量数据抽取的原理如题,有人可以简单的解释下吗?面试被问到这个问题,感觉回答得不是很好------解决思路----------------------设定一个基准,把数据都抽取好后,把源表所有的变动都记录下来,再一次抽取的时候,只把有变动的数据往目标表上抽。
21
热度 -
[数据仓库] 内销、外销、内销撤回、外销退回
内销、外销、内销退回、外销退回建立销售分析所需的数据仓库,是否需要把内销、外销、内销退回、外销退回分别建立事实表呢还是建一个表通过建立销售类别字段来区分这4种情况好呢?------解决思路----------------------如果字段完全一样的话放在类别里面区分方便些------解决思路---...
29
热度 -
[数据仓库] 基于“全表对照方式”的增量数据抽取
基于“全表对比方式”的增量数据抽取本帖最后由commonnx于2010-11-0823:43:15编辑典型的全表比对的方式是采用MD5校验码。ETL工具事先为要抽取的表建立一个结构类似的MD5临时表,该临时表记录源表主键以及根据所有字段的数据计算出来的MD5校验码。每次进行数据抽取时,对源表和MD5...
51
热度 -
[数据仓库] T-SQL访问ROLAP的疑点
T-SQL访问ROLAP的疑问.目前用SQLSERVER2000的数据库,如果这个OLAP是以ROLAP形式组织的话.是否能同时用T-SQL和MDX对其进行访问?------解决思路----------------------T-SQL是访问SQLServer服务,而MDX访问的是MSSQLServ...
108
热度 -
30
热度 -
[数据仓库] 大表优化,该怎么解决
大表优化请问各位大侠,我有一张表有一亿条记录,有6个字段:id,Surname,givenname,spouse_name,mother_name,year,除了一个字段id很少用到外,其它字段都是经常使用,但不会更新,删除,因为是一个数据仓库,所以我应该如何创建索引呢?------解决思路----...
121
热度 -
[数据仓库] 安装Informatica时出现异常,说磁盘空间不足,但实际下很足的啊
安装Informatica时出现错误,说磁盘空间不足,但实际上很足的啊?我重装过,第一次貌似没有这个问题。。。------解决思路----------------------试着删除C盘里的一些临时文件目录里的东西再试呢?------解决思路----------------------拿分,闪人--...
46
热度 -
[数据仓库] [数据仓库]什么是主数据治理
[数据仓库]什么是主数据管理主数据是指在整个企业范围内各个系统(操作/事务型应用系统以及分析型系统)间要共享的数据,?比如,可以是与客户(customers),供应商(suppliers),帐户(accounts)以及组织单位(organizationalunits)相关的数据。??主数据通常需要在...
560
热度 -
[数据仓库] 数据挖掘推荐系统MAE有关问题
数据挖掘推荐系统MAE问题有训练集和测试集,用训练集来预测目标用户对目标项目的评分。所以我理解的MAE是,根据测试集里目标用户对目标项目的实际评分,用训练集算出目标用户对目标项目的预测评分,用这两者算出用户的MAE,也就是说一个用户对应一个MAE?我的理解对不对?不对的话,正确的MAE怎么理解,怎么...
24
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(一)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(一)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
93
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(二)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(二)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
43
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(三)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(三)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
94
热度 -
[数据仓库] 数据挖掘方向就业有人懂得么
数据挖掘方向就业有人了解么?数据挖掘专业哪些学校比较牛?------解决方案--------------------中国人民大学------解决方案--------------------看个人...决不能因学校决定个人,,,,这是经验------解决方案--------------------跟学...
72
热度 -
[数据仓库] KETTLE中JS处置
KETTLE中JS处理EXCEL输入后,有一字段内容,有些记录该字段内容为空,若为空,则用上一记录的值。比如原始数据需要变成11111221113344455请问在JS中该怎么写?------解决方案--------------------Excel里面在去除空格类型那里,把所有的空格去掉。拖一个M...
85
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的功能。...
120
热度 -
[数据仓库] data migration -二 构造 临时数据仓库,用于提取数据
datamigration-2构造临时数据仓库,用于提取数据构造临时数据仓库,用于提取数据?设想在这个阶段完成大部分的商业逻辑转换工作,使用pentaho工具,帮助转换数据到临时表环境设置:1.临时表尽可能与新数据库表结构相同,但是当中会加几个帮助做逻辑的column类似flag?优点:集中转换工作...
410
热度 -
[数据仓库] 应用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(四)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(四)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
79
热度 -
[数据仓库] 应用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(五)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(五)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
66
热度 -
[数据仓库] 数据挖掘:Top 十 Algorithms in Data Mining(六)PageRank
数据挖掘:Top10AlgorithmsinDataMining(六)PageRankPagerank因google的快熟发展并提供高质量搜索结果而受到广泛关注。Pagerank的主要目标是评价网页的重要程度,并以此作为网页的排名依据。算法主要参考网页被引用的数量,及引用者的权威性。参考下面的简单的...
217
热度 -
[数据仓库] 数据挖掘:Top 十 Algorithms in Data Mining(四)Apriori 关联分析
数据挖掘:Top10AlgorithmsinDataMining(四)Apriori关联分析http://tnove.com先引用IDMer整理的图初步了解下Apriori上面对apriori算已经做了简单介绍。该算法最早用于购物篮挖掘,频繁项的挖掘。其伪代码为:Apriori算法的缺点在于其在实际...
77
热度