-
[数据仓库] 数据仓库的魂灵-元数据
数据仓库的灵魂--元数据企业数据量的日益膨胀以及数据的多样性和复杂性,使人们不禁感叹二十年前查询不到数据是因为数据太少,而现如今查询不到数据则是因为数据太多了。如何及时地从海量的原始数据中提取更多、更好地信息,为企业的决策分析服务,成为人们一直关心的问题。在这种情况下,数据仓库技术应运而生。数据仓库...
85
热度 -
[数据仓库] 数据挖掘 学习札记 概述篇
数据挖掘学习笔记概述篇数据挖掘学习笔记1.概述数据挖掘火热的主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。数据挖掘是信息技术自然进化的结果。进化过程的见证是数据库工业界开发以下功能:数据收集和数据库创建,数据管理(包括数据存储和提取,数据库事务处理),以及数据分...
18
热度 -
[数据仓库] 数据挖掘之离散化跟概念分层学习笔记
数据挖掘之离散化和概念分层学习笔记离散化和概念分层产生通过将属性域划分为区间,离散化技术可以用来减少给定连续属性值的个数。区间的标号可以替代实际的数据值。如果使用基于判定树的分类挖掘方法,减少属性值的数量特别有好处。通常,这种方法是递归的,大量的时间花在每一步的数据排序上。因此,待排序的不同值越少,...
121
热度 -
[数据仓库] 数据仓库跟数据挖掘的OLAP 技术
数据仓库和数据挖掘的OLAP技术数据仓库和数据挖掘的OLAP技术数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理决策制定?面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是构造组织机构的日常操作和事务处理。因此,数据仓库排...
352
热度 -
[数据仓库] 数据挖掘之原语、语媾和系统结构学习笔记
数据挖掘之原语、语言和系统结构学习笔记数据挖掘原语、语言和系统结构?希望用户能够通过使用一组数据挖掘原语与数据挖掘系统通讯,以支持有效的和有成果的知识发现。这组原语包括说明数据库的部分或用户感兴趣的数据集(包括感兴趣的数据库属性或数据仓库维),要挖掘的知识类型,用于指导挖掘过程的背景知识,模式评估兴...
23
热度 -
[数据仓库] 数据挖掘之概念描述:特点与比较学习笔记
数据挖掘之概念描述:特征与比较学习笔记概念描述:特征与比较从数据分析的角度,数据挖掘可以分为两类:描述式数据挖掘和预测式数据挖掘。描述式数据挖掘以简洁概要的方式描述数据,并提供数据的有趣的一般性质。预测式数据挖掘分析数据,建立一个或一组模型,并试图预测新数据集的行为。?数据库通常存放大量的细节数据。...
31
热度 -
[数据仓库] 数据挖掘之聚类分析学习札记(1)
数据挖掘之聚类分析学习笔记(1)聚类分析?聚类(clustering)就是将数据对象分组成为多个类或簇(cluster),在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。相异度是基于描述对象的属性值来计算的。距离是经常采用的度量方式。聚类分析源于许多研究领域,包括数据挖掘,统计学,...
34
热度 -
[数据仓库] 数据挖掘之聚类分析学习札记(2)
数据挖掘之聚类分析学习笔记(2)聚类分析中的数据类型?假设要聚类的数据集合包含n个数据对象,许多基于内存的聚类算法选择如下两种有代表性的数据结构:数据矩阵(Datamatrix,或称为对象属性结构):它用p个变量(也称为属性)来表现n个对象,例如用年龄,身高,性别,种族等属性来表现对象“人”。这种数...
85
热度 -
[数据仓库] 数据挖掘之分门别类和预测学习笔记
数据挖掘之分类和预测学习笔记分类和预测数据库内容丰富,蕴藏大量信息,可以用来作出智能的商务决策。分类和预测是两种数据分析形式,可以用于提取描述重要数据类的模型或预测未来的数据趋势。然而,分类是预测分类标号(或离散值),而预测建立连续值函数模型?数据分类是一个两步过程。第一步,建立一个模型,描述预定的...
96
热度 -
[数据仓库] 数据挖掘之数据预加工
数据挖掘之数据预处理数据预处理?目的:预处理数据,提高数据质量,从而提高挖掘结果的质量?数据预处理的方法包括:数据清理、数据集成和转换、数据归约。数据清理可以去掉数据中的噪音,纠正不一致。数据集成将数据由多个源合并成一致的数据存储,如数据仓库或数据方。数据变换(如规范化)也可以使用。例如,规范化可以...
103
热度 -
[数据仓库] 数据挖掘之复杂门类数据的挖掘学习笔记(3)
数据挖掘之复杂类型数据的挖掘学习笔记(3)Web挖掘万维网目前是一个巨大,分布广泛,全球性的信息服务中心,它涉及新闻,广告,消费信息,金融管理,教育,政府,电子商务,和许多其他信息服务。Web还包含了丰富和动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供了丰富的资源。然而基于以下的...
118
热度 -
[数据仓库] 数据仓库设计基础-关系模型跟多维模型
数据仓库设计基础--关系模型和多维模型专业数据仓库面临的一个问题是数据仓库中数据库设计的基本模型选取问题。广泛采用的数据库设计模型有两种,关系型和多维型。下面介绍两种模型,及其两种方法的区别和在数据仓库中的应用,两种方法的优缺点。在建立数据仓库过程中,对于数据库设计而言,建立关系型数据库是最佳的长期...
37
热度 -
[数据仓库] oracle desc下令
oracledesc命令我用dos执行oracle数据库的desc命令语法,提示非法的标示符是什么原因呢!分享到:------解决方案--------------------用sqlplus登录没有?------解决方案--------------------需要用Sqlpus登录数据库后才能执行-...
31
热度 -
[数据仓库] 数据挖掘之复杂类型数据的发掘学习笔记(2)
数据挖掘之复杂类型数据的挖掘学习笔记(2)多媒体数据挖掘"什么是多媒体数据库?"多媒体数据库是指存储和管理大量多媒体对象的数据库,如音频数据,图象数据,视频数据,序列数据,以及超文本数据,包含文本,文本标记(textmarkup),和链接(linkage)。?由于音频视频设备,CD-ROMs,和因特...
89
热度 -
[数据仓库] 数据挖掘之复杂类型数据的开掘学习笔记(1)
数据挖掘之复杂类型数据的挖掘学习笔记(1)复杂类型数据的挖掘?复杂类型数据的挖掘,这包括复杂对象,空间数据,多媒体数据,时间序列数据,文本数据,和Web数据?复杂结构化数据(complexstructureddata)的存取方法在对象关系和面向对象数据库系统已有研究。在这些系统中,大量复杂数据对象组...
68
热度 -
[数据仓库] BIEE出现断言异常
BIEE出现断言错误在做BI展现时,我拖三个维度进行展现,这个时候的结果显示是正常的,但我若把其中一个维度排除掉(隐藏,不显示),就会出现错误,错误显示是说内部断言的条件失败了。我感觉数据本身是没错的,因为不隐藏维度的时候数据的显示是正确的,为什么隐藏之后就会变成这样呢?不知道各位大侠有遇到过这个错...
57
热度 -
[数据仓库] 数据仓库工作可否胜任数据挖掘
数据仓库工作能否胜任数据挖掘?我做BI已经有三年多了,这里面主要用到一些teradata,oracle;Etl方面有用perl实现,也用存储过程实现,还有用informatica实现的报表方面主要用cognos工具现在我打算转行做数据挖掘的话,我上面这些经验是否有用?数据挖掘需要用到哪些具体的技术,...
66
热度 -
[数据仓库] Hive数据仓库预备地震局测试数据
Hive数据仓库准备地震局测试数据安装部署可以参考:http://blog.fens.me/hadoop-hive-intro/非常详细下面介绍如何准备测试数据:?到hive>环境输入命令:1、创建表??createtableifnotexistsdzj(riqistring,shijians...
30
热度 -
[数据仓库] 使用Weka开展数据挖掘
使用Weka进行数据挖掘1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便...
79
热度 -
[数据仓库] 使用Weka进展数据挖掘
使用Weka进行数据挖掘1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便...
42
热度