我自己想做一个用户行为数据的历史分析的东西,具体的细节不说了,我抽象一下
比如说有一个表A,
create table A
(
user_id int not null primary key, #用户ID号
amount int not null, #用户一次消费金额
time int not null, #消费时间
);
在这个表中已经记录了过去的数据(也许有几十万条)那么我想统计一下用户的消费金额,
以便了解用户的消费习惯,举个例子来说如果一个用户的突然要插入的金额非常的大,但是它的
历史数据显示他从来没有消费过那么多的钱,那么就有必要对他进行留意了,当然这只是一个方面,
也许我需要考虑的方面还很多。
那么我的问题是:究竟应该考虑哪些关于金额方面的特征值呢,我现在想到的貌似只有均值,
最大、最小值,因为我才接触这方面,所以希望有经验的做过数据挖掘方面的朋友可以帮助我,谢谢!!
------解决方案--------------------
如果这样,也就是说你现在想猜测用户可能会有哪些需求。这个需要相关的行业知识了。CSDN上的程序员大部分都不太了解这个。
猜起来的话,比如
天天连续消费的。
每次到同一家店的。
消费金额突变的。
长期未消费的。
性别与消费的关联,
职业与消费的关联。
。。。
凭空想是比较容易,关键是要找出将来极有可能被用到的。 最好找些客户聊聊,会有不少收获。
------解决方案--------------------
增加一个TYPE、PLACE字段,记录消费类型、消费地点, 比如买车、房、化妆品等等,以及在什么地方
消费,专卖店、超市等等