-
[数据仓库] 数据挖掘推荐系统MAE有关问题
数据挖掘推荐系统MAE问题有训练集和测试集,用训练集来预测目标用户对目标项目的评分。所以我理解的MAE是,根据测试集里目标用户对目标项目的实际评分,用训练集算出目标用户对目标项目的预测评分,用这两者算出用户的MAE,也就是说一个用户对应一个MAE?我的理解对不对?不对的话,正确的MAE怎么理解,怎么...
24
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(一)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(一)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
93
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(二)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(二)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
43
热度 -
[数据仓库] 数据挖掘方向就业有人懂得么
数据挖掘方向就业有人了解么?数据挖掘专业哪些学校比较牛?------解决方案--------------------中国人民大学------解决方案--------------------看个人...决不能因学校决定个人,,,,这是经验------解决方案--------------------跟学...
72
热度 -
[数据仓库] KETTLE中JS处置
KETTLE中JS处理EXCEL输入后,有一字段内容,有些记录该字段内容为空,若为空,则用上一记录的值。比如原始数据需要变成11111221113344455请问在JS中该怎么写?------解决方案--------------------Excel里面在去除空格类型那里,把所有的空格去掉。拖一个M...
85
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的功能。...
120
热度 -
[数据仓库] data migration -二 构造 临时数据仓库,用于提取数据
datamigration-2构造临时数据仓库,用于提取数据构造临时数据仓库,用于提取数据?设想在这个阶段完成大部分的商业逻辑转换工作,使用pentaho工具,帮助转换数据到临时表环境设置:1.临时表尽可能与新数据库表结构相同,但是当中会加几个帮助做逻辑的column类似flag?优点:集中转换工作...
410
热度 -
[数据仓库] 应用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(五)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(五)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
66
热度 -
[数据仓库] 数据挖掘学习笔记之ID3算法(一)
数据挖掘学习札记之ID3算法(一)参考:1.Wiki上的ID3algorithm2.百度文库里的一个PPT,有算例,决策树ID3算法3.百度文库,PPT,很多算例,开始有信息理论,极力推荐阅读,ID3算法4.用Python实现ID3和C4.5决策树ID3和C4.5算法Python实现源码下面是整理的...
74
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(二)
数据挖掘学习札记之KNN算法(二)在数据挖掘学习札记之KNN算法(一)里,使用sklearn模块对例子进行了求解,但是并不清楚k的取值。下面是我写的一个Python代码,程序采用“小题大做”的方式,一方面可以熟悉算法,另一方面练习Python编程,可以看到,当k取1,2,3,4,5时,...
56
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(三)
数据挖掘学习札记之KNN算法(三)1.如何确定近邻数k的值?答:可通过实验确定。从k=1开始,使用检验集估计分类器的错误率。每次k增加1,选取产生最小错误率的值。2.在特征空间的维数和训练数据大时,如何对训练数据进行快速k近邻搜索?答:可使用特殊的结构存储训练数据,以减少...
60
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(一)
数据挖掘学习札记之KNN算法(一)参考:1.KNN算法介绍,Python程序和一个简单算例2.k-nearestneighboralgorithm基本想法:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。俗话叫,“随大流”。算法描述:1.依公式计算Ite...
80
热度 -
58
热度 -
[数据仓库] 商业智能的执行步骤 数据仓库
商业智能的实施步骤数据仓库商业智能的实施步骤数据仓库的特点1、面向主题操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。2、集成的数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据...
567
热度 -
[数据仓库] 多表 数据挖掘,该如何处理
多表数据挖掘我是一个菜鸟问一下有什么办法可以多表数据挖掘吗还是必须合到一个表中去处理呢------解决方案--------------------表有大小吗?让多个小表笛卡尔积,然后与大表hashjoin制造雪花片效果
232
热度 -
94
热度 -
23
热度 -
[数据仓库] 数据挖掘是怎么解决有关问题的
数据挖掘是如何解决问题的数据挖掘是如何解决问题的本节通过几个数据挖掘实际案例来诠释如何通过数据挖掘解决商业中遇到的问题。2.1.1节中关于“啤酒和尿不湿”的故事是数据挖掘中最经典的案例。而Target公司通过“怀孕预测指数”来预测女顾客是否怀孕的案例也是近来为数据挖掘学者最津津乐道的一个话题。很多人...
74
热度 -
[数据仓库] 关于学习银行数据仓库的迷茫,该怎么处理
关于学习银行数据仓库的迷茫我现在在一个小公司实习,做数据仓库,硕士在读,之前在通信公司实习,没有数据仓库经验。公司现在让我做ETL了,这个公司是自己开发的ETL系统,说实施了几年觉得需要重构,让我和另一个人重构在老板的指导下重构这个系统。是做银行核心业务方面的。但我现在也就基本了解一点ETL的东西。...
57
热度 -
[数据仓库] 干银行数据仓库建模有前途吗
做银行数据仓库建模有前途吗我现在在一个给银行做数据仓库咨询的小公司实习,老板昨天说让我做银行的数据仓库建模,就是分主题为客户、产品、账户、交易、渠道、机构之类的。请问这个有意思吗,,技术含量在什么地方,以后做这个的相关工作多吗,有前途吗?说让我看什么元数据,聚集设计,事实表,维表等。还让我看一篇名字...
103
热度