-
234
热度 -
[数据仓库] 数据仓库里的订单主从表的格式是如何样的
数据仓库里的订单主从表的格式是怎么样的?业务表是主从结构的存到数据库也是主从结构吗?------解决方案--------------------看情况,微软的事例里面是建在一张事实表上的,然后对该表划分层次,最后自身做事实维度
114
热度 -
[数据仓库] Thinking in BigDate(12)大数据之有指点数据挖掘方法模型序(3)
ThinkinginBigDate(12)大数据之有指导数据挖掘方法模型序(3)接着上面博客继续探讨:有指导数据挖掘方法模型步骤5、修复问题数据所有数据都是脏的。所有的数据都是有问题。究竟是不是问题有时可能随着数据挖掘技术的变化而变化。对于某些技术,例如决策树,缺失值和离群点并不会造成...
71
热度 -
[数据仓库] 数据挖掘入门引导(免费)
数据挖掘入门指引(免费)开源力量公开课第47期:数据挖掘入门指引(免费)报名地址:http://www.osforce.cn/openclass/64/show(报名后显示直播地址)课程背景:大数据的核心是价值,如何挖掘数据价值,应用是引导,挖掘是关键。数据挖掘是交叉学科,统计学和机器学习是其中最重...
103
热度 -
[数据仓库] 关于数据仓库提议、感想
关于数据仓库建议、感想现代数据仓库之父,WilliamH.Inmon大师的著作:《数据仓库(BuildingtheDataWarehouse)》定义:数据仓库是:面向主题的、集成的、稳定的、面向时间的数据集合。数据平台之问(当前问题现象)需求响应慢数据质量不可靠数据不可信维护成本高数据安全不可控数据...
55
热度 -
[数据仓库] 4. 逻辑回归中引入高阶项
数据挖掘方法(7):解读逻辑回归一.数据描述来源:数据集合(http://download.csdn.net/detail/huangxia73/7059709)描述:电信数据,有多个属性,用来预测客户流失。载入数据如下:>call_consumer<-read.table(file=&...
126
热度 -
[数据仓库] 数据挖掘学习笔记-决策树C4.5
数据挖掘学习笔记--决策树C4.5在网上和教材上也看了有很多数据挖掘方面的很多知识,自己也学习很多,就准备把自己学习和别人分享的结合去总结下,以备以后自己回头看,看别人总还是比不上自己写点,及时有些不懂或者是没有必要。定义:分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习说白...
52
热度 -
[数据仓库] 關於數據庫服務器問題,该怎么处理
關於數據庫服務器問題做一個大小在1T左右的數據庫服務器,用asp.net技術實現分析數據的展示,問下服務器用X3850,12顆15000轉的RD,服務器設備的投入大概是30萬人民幣,這樣的投入能否滿足要求啊,小弟不太會評估,求意見------解决方案--------------------OLTPO...
55
热度 -
[数据仓库] 数据挖掘学习笔记之人工神经网络(1)
数据挖掘学习笔记之人工神经网络(一)由于本人这段时间在学习数据挖掘的知识,学习了人工神经网络刚好就把学习的一些笔记弄出来,也为以后自己回头看的时候方便些。神经网络学习方法对于逼近实数值、离散值或向量值的目标函数提供了一种健壮性很强的方法。对于某...
136
热度 -
[数据仓库] 数据挖掘学习笔记之人工神经网络(2)
数据挖掘学习笔记之人工神经网络(二)多层网络和反向传播算法我们知道单个感知器仅能表示线性决策面。然而我们可以将许多的类似感知器的模型按照层次结构连接起来,这样就能表现出非线性决策的边界了,这也叫做多层感知器,重要的是怎么样学习多层感知器,这个问题有两个方面:1、要学习网络结构;2、要学...
69
热度 -
[数据仓库] 数据挖掘 IBM SPSS Modeler 生手使用入门
数据挖掘IBMSPSSModeler新手使用入门http://www.360doc.com/content/11/0602/10/63626_121118701.shtml#
166
热度 -
[数据仓库] 大块头哥的大数据之路(8)- 数据仓库命名规范
胖子哥的大数据之路(8)-数据仓库命名规范引言:从对大数据的狂热到理性的回归,项目实施起到了醍醐灌顶的作用,大数据技术只能作为一种IT基础架构(存储+运算),而实际的工程化实施,还是要回归到IT传统技术,最近在整合大数据时代的数据仓库框架,希望能有更多的人参与进来。数据仓库实施数据模型的组织...
96
热度 -
[数据仓库] 数据挖掘十大算法-EM算法(最大期待算法)
数据挖掘十大算法----EM算法(最大期望算法)概念在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable)。最大期望经常用在机器学习和计算机视觉的数据...
42
热度 -
[数据仓库] 2. Referrence
【数据挖掘】分类之knn1.算法简介knn的思想很简单:计算待分类的数据点与训练集所有样本点,取距离最近的k个样本;统计这k个样本的类别数量;根据多数表决方案,取数量最多的那一类作为待测样本的类别。距离度量可采用Euclideandistance,Manhattandistance和cosine。用...
207
热度 -
[数据仓库] 数据挖掘十大算法-K比邻算法
数据挖掘十大算法--K近邻算法k-近邻算法是基于实例的学习方法中最基本的,先介绍基于实例学习的相关概念。一、基于实例的学习。1、已知一系列的训练样例,很多学习方法为目标函数建立起明确的一般化描述;但与此不同,基于实例的学习方法只是简单地把训练样例存储起来。从这些实例中泛化的工作被推迟到必须分类新的实...
117
热度 -
[数据仓库] 【数据挖掘】分门别类之decision tree
【数据挖掘】分类之decisiontree1.ID3算法ID3算法是一种典型的决策树(decisiontree)算法,C4.5,CART都是在其基础上发展而来。决策树的叶子节点表示类标号,非叶子节点作为属性测试条件。从树的根节点开始,将测试条件用于检验记录,根据测试结果选择恰当的分支;直至到达叶子节...
90
热度 -
[数据仓库] 数据挖掘十大算法-K-均值聚类算法
数据挖掘十大算法--K-均值聚类算法一、相异度计算在正式讨论聚类前,我们要先弄清楚一个问题:如何定量计算两个可比较元素间的相异度。用通俗的话说,相异度就是两个东西差别有多大,例如人类与章鱼的相异度明显大于人类与黑猩猩的相异度,这是能我们直观感受到的。但是,计算机没有这种直观感受能力,我们必须对相异度...
208
热度 -
[数据仓库] 2.Referrence
【数据挖掘】分类之NaïveBayes1.算法简介朴素贝叶斯(NaiveBayes)是无监督学习的一种常用算法,易于实现,没有迭代,并有坚实的数学理论(即贝叶斯定理)作为支撑。本文以拼写检查作为例子,讲解NaiveBayes分类器是如何实现的。对于用户输入的一个单词(words),拼写检查...
116
热度 -
[数据仓库] asp.net 如若开发BI,基于什么数据库好呢
asp.net如果开发BI,基于什么数据库好呢?熟悉asp.netc#,oracle,sqlserver懂一些。想开发BI系统,aspx+oracle?还是aspx+mssql?犹豫中...请大家赐教!------解决方案--------------------ASP。NET,微软肯定会告诉你用SQ...
83
热度 -
[数据仓库] 数据挖掘十大算法-Apriori算法
数据挖掘十大算法--Apriori算法一、Apriori算法概述Apriori算法是一种最有影响力的挖掘布尔关联规则的频繁项集的算法,它是由RakeshAgrawal和RamakrishnanSkrikant提出的。它使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找...
46
热度