首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
The Go Programming Language
http://golang.org/
Go Playground
Go Projects
Revel Web Framework
beego
华为云
V2EX  ›  Go

分词完成得到切片,如何快速的通过停用词表剔除多余的词

  •  
  •   zarte · 208 天前 · 398 次点击
    这是一个创建于 208 天前的主题,其中的信息可能已经有所发展或是发生改变。

    求个高效的方法。

    3 回复  |  直到 2018-04-28 10:21:14 +08:00
        1
    gabon   208 天前 via Android   ♥ 1
    分词 n 个,停用词 m 个,复杂度就 On。分完的每个词你得最少扫描一遍吧。停用词用 hashset 保存,foreach 迭代分完的词。
        2
    ByteChen   207 天前
    分词不会太麻烦吗
        3
    zarte   207 天前
    @ByteChen 那也没办法呀,要统计热点。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1591 人在线   最高记录 3911   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 19ms · UTC 16:35 · PVG 00:35 · LAX 08:35 · JFK 11:35
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1