-
[数据仓库] 数据挖掘方向就业有人懂得么
数据挖掘方向就业有人了解么?数据挖掘专业哪些学校比较牛?------解决方案--------------------中国人民大学------解决方案--------------------看个人...决不能因学校决定个人,,,,这是经验------解决方案--------------------跟学...
72
热度 -
[数据仓库] KETTLE中JS处置
KETTLE中JS处理EXCEL输入后,有一字段内容,有些记录该字段内容为空,若为空,则用上一记录的值。比如原始数据需要变成11111221113344455请问在JS中该怎么写?------解决方案--------------------Excel里面在去除空格类型那里,把所有的空格去掉。拖一个M...
85
热度 -
[数据仓库] 施用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的功能。...
120
热度 -
[数据仓库] data migration -二 构造 临时数据仓库,用于提取数据
datamigration-2构造临时数据仓库,用于提取数据构造临时数据仓库,用于提取数据?设想在这个阶段完成大部分的商业逻辑转换工作,使用pentaho工具,帮助转换数据到临时表环境设置:1.临时表尽可能与新数据库表结构相同,但是当中会加几个帮助做逻辑的column类似flag?优点:集中转换工作...
410
热度 -
[数据仓库] 应用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(五)
使用SQLServerAnalysisServices数据挖掘的关联规则实现商品推荐功能(五)假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?这个功能在很多电商类网站都有,那么,通过SQLServerAnalysisServices的数据挖掘功能,你也可以轻松的来构建类似的...
66
热度 -
[数据仓库] 数据挖掘学习笔记之ID3算法(一)
数据挖掘学习札记之ID3算法(一)参考:1.Wiki上的ID3algorithm2.百度文库里的一个PPT,有算例,决策树ID3算法3.百度文库,PPT,很多算例,开始有信息理论,极力推荐阅读,ID3算法4.用Python实现ID3和C4.5决策树ID3和C4.5算法Python实现源码下面是整理的...
74
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(二)
数据挖掘学习札记之KNN算法(二)在数据挖掘学习札记之KNN算法(一)里,使用sklearn模块对例子进行了求解,但是并不清楚k的取值。下面是我写的一个Python代码,程序采用“小题大做”的方式,一方面可以熟悉算法,另一方面练习Python编程,可以看到,当k取1,2,3,4,5时,...
56
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(三)
数据挖掘学习札记之KNN算法(三)1.如何确定近邻数k的值?答:可通过实验确定。从k=1开始,使用检验集估计分类器的错误率。每次k增加1,选取产生最小错误率的值。2.在特征空间的维数和训练数据大时,如何对训练数据进行快速k近邻搜索?答:可使用特殊的结构存储训练数据,以减少...
60
热度 -
[数据仓库] 数据挖掘学习笔记之KNN算法(一)
数据挖掘学习札记之KNN算法(一)参考:1.KNN算法介绍,Python程序和一个简单算例2.k-nearestneighboralgorithm基本想法:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。俗话叫,“随大流”。算法描述:1.依公式计算Ite...
80
热度 -
58
热度 -
[数据仓库] 商业智能的执行步骤 数据仓库
商业智能的实施步骤数据仓库商业智能的实施步骤数据仓库的特点1、面向主题操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。2、集成的数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据...
567
热度 -
[数据仓库] 多表 数据挖掘,该如何处理
多表数据挖掘我是一个菜鸟问一下有什么办法可以多表数据挖掘吗还是必须合到一个表中去处理呢------解决方案--------------------表有大小吗?让多个小表笛卡尔积,然后与大表hashjoin制造雪花片效果
232
热度 -
94
热度 -
23
热度 -
[数据仓库] 数据挖掘是怎么解决有关问题的
数据挖掘是如何解决问题的数据挖掘是如何解决问题的本节通过几个数据挖掘实际案例来诠释如何通过数据挖掘解决商业中遇到的问题。2.1.1节中关于“啤酒和尿不湿”的故事是数据挖掘中最经典的案例。而Target公司通过“怀孕预测指数”来预测女顾客是否怀孕的案例也是近来为数据挖掘学者最津津乐道的一个话题。很多人...
74
热度 -
[数据仓库] 关于学习银行数据仓库的迷茫,该怎么处理
关于学习银行数据仓库的迷茫我现在在一个小公司实习,做数据仓库,硕士在读,之前在通信公司实习,没有数据仓库经验。公司现在让我做ETL了,这个公司是自己开发的ETL系统,说实施了几年觉得需要重构,让我和另一个人重构在老板的指导下重构这个系统。是做银行核心业务方面的。但我现在也就基本了解一点ETL的东西。...
57
热度 -
[数据仓库] 干银行数据仓库建模有前途吗
做银行数据仓库建模有前途吗我现在在一个给银行做数据仓库咨询的小公司实习,老板昨天说让我做银行的数据仓库建模,就是分主题为客户、产品、账户、交易、渠道、机构之类的。请问这个有意思吗,,技术含量在什么地方,以后做这个的相关工作多吗,有前途吗?说让我看什么元数据,聚集设计,事实表,维表等。还让我看一篇名字...
103
热度 -
[数据仓库] :亿级MySQL数据库数据统计
求助:亿级MySQL数据库数据统计状况:目前有几张表,都是亿级别的数据,直接存在MySQL中.现在想要对表进行分表分库,以提高性能.于是问题就出来了:分表分库后要出报表统计明细之类的,需要怎么去做呢?请问有没什么好的方法,在对数据分析方面的东西.就是我即可以分表分库.也能实现以后的这类各种统计,计算...
69
热度 -
[数据仓库] 数据仓库系统维护口试
数据仓库系统维护面试哪位大哥有数据仓库维护方面的资料啊,小弟明天要参加一个数据仓库维护有关的面试,这次机会对我来说极其重要,网上也找不到很好的资料,求求哪位大哥能帮帮忙,洗涤感激不尽,谢谢了------解决方案--------------------无非就是些原理的知识吧------解决方案----...
197
热度 -
[数据仓库] 数据分析的路该如何走?新手上路,求指点
数据分析的路该怎么走?新手上路,求指点.目前公司的数据库是几百个G的MySQL,但是数据挖掘/分析这块还是空白,想趁这个机会自己学习下.也为公司数据提炼出点价值..首先日志分析之类的,一想到就是Hadoop及周边类似产品...但如果是MySQL呢?需要怎么去处理呢?目前公司过亿记录的表有好几张,出于...
84
热度