当前位置: 代码迷 >> 企业开发 >> 稿子的内容识别
  详细解决方案

稿子的内容识别

热度:128   发布时间:2016-05-11 08:18:16.0
文章的内容识别
假设现在有体育,娱乐,汽车等类别,那如何根据一篇文章的内容识别其类别呢?
(1)如果采用关键词方法,数据库如何设计?
(2)如何让程序具有人工智能?
(3)中文或者日文的话,怎样对文章进行分词啊?
------解决思路----------------------
建议你看一下Data mining: practical machine learning tools and techniques 和Data Mining: Concepts and Techniques这两本书,讲到了人工智能及数据挖掘的东西.关于多语言的问题,无论是关键词还是文章内容建议统一用unicode方式存取,这样比较的时候就不存在编码转化的问题了。
  相关解决方案
本站暂不开放注册!
内测阶段只得通过邀请码进行注册!
 
  • 最近登录:Sun Feb 26 22:52:17 CST 2017
  • 最近登录:Sun Feb 26 22:52:17 CST 2017
  • 最近登录:Sun Feb 26 22:52:17 CST 2017
  • 最近登录:Sun Feb 26 22:52:17 CST 2017
  • 最近登录:Sun Feb 26 22:52:17 CST 2017