数据分拆,该如何解决_数据仓库

数据分拆
请问如何分拆数据得到当中的重点字眼？
例如：字段A 为“广州市天河区珠江新城*****” 字段B2为“天河区珠江新城……”。如何拆分得到重点字词“珠江新城”呢？
现在工作中只有这些数据存在数据库当中，且数量非常大。如何通过方法来查找出重点字词。又或者某些字词出现的频率较多的呢？
------解决方案--------------------------------------------------------
用到分词技术，训练模型。
------解决方案--------------------------------------------------------
1 编辑词库，珠江新城就是一个词条，你应该不止这一个词条吧
2 分词，采用最小切分法，保证出来的词，都是重点
------解决方案--------------------------------------------------------
路过！
------解决方案--------------------------------------------------------
这个~~~建词库的话是不是有点麻烦呢？
------解决方案--------------------------------------------------------
我也遇到类似的问题。。
------解决方案--------------------------------------------------------
这个环节属于ETL,预处理,不是挖掘的核心.
------解决方案--------------------------------------------------------
DINGDINGDINGDING
------解决方案--------------------------------------------------------
高呀，咋也学习学习
------解决方案--------------------------------------------------------
。。。打酱油了