请问如何分拆数据得到当中的重点字眼?
例如:字段A 为“广州市天河区珠江新城*****” 字段B2为“天河区珠江新城……”。如何拆分得到重点字词“珠江新城”呢?
现在工作中只有这些数据存在数据库当中,且数量非常大。如何通过方法来查找出重点字词。又或者某些字词出现的频率较多的呢?
------解决方案--------------------------------------------------------
用到 分词技术,训练模型。
------解决方案--------------------------------------------------------
1 编辑词库,珠江新城就是一个词条,你应该不止这一个词条吧
2 分词,采用最小切分法,保证出来的词,都是重点
------解决方案--------------------------------------------------------
路过!
------解决方案--------------------------------------------------------
这个~~~建词库的话是不是有点麻烦呢?
------解决方案--------------------------------------------------------
我也遇到类似的问题。。
------解决方案--------------------------------------------------------
这个环节属于ETL,预处理,不是挖掘的核心.
------解决方案--------------------------------------------------------
DINGDINGDINGDING
------解决方案--------------------------------------------------------
高呀,咋也学习学习
------解决方案--------------------------------------------------------
。。。打酱油了