我自己想做一个用户行为数据的历史分析的东西,具体的细节不说了,我抽象一下
比如说有一个表A,
create table A
(
user_id int not null primary key, #用户ID号
amount int not null, #用户一次消费金额
time int not null, #消费时间
);
在这个表中已经记录了过去的数据(也许有几十万条)那么我想统计一下用户的消费金额,
以便了解用户的消费习惯,举个例子来说如果一个用户的突然要插入的金额非常的大,但是它的
历史数据显示他从来没有消费过那么多的钱,那么就有必要对他进行留意了,当然这只是一个方面,
也许我需要考虑的方面还很多。
那么我的问题是:究竟应该考虑哪些关于金额方面的特征值呢,我现在想到的貌似只有均值,
最大、最小值,因为我才接触这方面,所以希望有经验的做过数据挖掘方面的朋友可以帮助我,谢谢!!
------解决方案--------------------
------解决方案--------------------
增加一个TYPE、PLACE字段,记录消费类型、消费地点, 比如买车、房、化妆品等等,以及在什么地方
消费,专卖店、超市等等