请问如何分拆数据得到当中的重点字眼?
例如:字段A 为“广州市天河区珠江新城*****” 字段B2为“天河区珠江新城……”。如何拆分得到重点字词“珠江新城”呢?
现在工作中只有这些数据存在数据库当中,且数量非常大。如何通过方法来查找出重点字词。又或者某些字词出现的频率较多的呢?
------解决方案--------------------
用到 分词技术,训练模型。
------解决方案--------------------
1 编辑词库,珠江新城就是一个词条,你应该不止这一个词条吧
2 分词,采用最小切分法,保证出来的词,都是重点
------解决方案--------------------
路过!
------解决方案--------------------
这个~~~建词库的话是不是有点麻烦呢?
------解决方案--------------------
我也遇到类似的问题。。
------解决方案--------------------
这个环节属于ETL,预处理,不是挖掘的核心.
------解决方案--------------------
DINGDINGDINGDING
------解决方案--------------------
高呀,咋也学习学习
------解决方案--------------------
。。。打酱油了