首页   注册   登录

Aether

Hello world
V2EX 第 621 号会员,加入于 2010-07-17 17:37:54 +08:00
:)
Aether 最近回复了
说了这么多,只是和自己回音交谈,没有一点儿具体的东西。
这只是一个死循坏。
38 天前
回复了 pkv 创建的主题 分享创造 一个“起名”小工具
起名字最难的:
1、你喜欢;
2、字好写,易读容易认;
3、开音节朗朗上口;
4、区格印象。
56 天前
回复了 lixuda 创建的主题 Python Python 英文单词统计有什么好的库吗?
@lixuda 我搞错了发帖人和楼下回复人了。道个歉(捂脸.gif ……)
56 天前
回复了 POPOEVER 创建的主题 分享发现 Path 要关张了
@POPOEVER 我是电子幽灵👻
56 天前
回复了 lixuda 创建的主题 Python Python 英文单词统计有什么好的库吗?
虽然你有不必要的情绪,但我觉得这不属于问题的范畴。如果你翻看过我的发帖,你会发现我之所以回复你是因为我之前做过一些相关的工作,觉得也许对你可能有所帮助。至于有些人觉得我有什么姿态,我只能说是相如心。

我看了下回复,大概意思没有任何回复者至少和我一样,曾经真的动手解决过类似的实际问题。

如果你只需要简单粗糙,那么按照空格分拆就足够好,数组就可以满足你的需要。

如果你需要清洗,问题就变多。英文里有些单词的变化形态是跟着句型走的。所以你需要先做句子拆分,然后根据上下文做词性还原。有了词性,你才能把单词还原到正确的原始形态,才能得出足够精确的统计。

关于词性还原所需要的库我记得有专门的,大约是 2-3 个可选,各有优劣。自然语言库很强大但也有不足之处,其中也包括比较繁琐的部分。此外还有大小写、专有名词等问题,都需要一一解决。

并没有直接回答你的问题,但还是希望对你有所帮助。
58 天前
回复了 POPOEVER 创建的主题 分享发现 Path 要关张了
你看看,没人理你。
62 天前
回复了 macwhirr 创建的主题 iPhone 以后基本要告别 iPhone 了?
@helionzzz 神逻辑。这个和国内国外有什么关系?……👍
65 天前
回复了 lixuda 创建的主题 Python Python 英文单词统计有什么好的库吗?
1、请先查一下“如何提出好的问题”。
2、什么叫做“英文单词统计”和“好”?在这里的定义到底是啥?
@est 对。


==============

各种各样的观察和观点,无所谓对错。但是有:
1、简单与否
2、是否可预测
3、预测精度如何

如果对上面 3 项不敏感,可以采纳任何一种观点:比如整个宇宙和多元宇宙都正在围绕着我手边这个马克杯在旋转,而且其轨迹非常复杂,导致你们人类搞不懂而已。这个观察本身无懈可击。
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3490 人在线   最高记录 3821   ·  
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.1 · 9ms · UTC 05:56 · PVG 13:56 · LAX 21:56 · JFK 00:56
♥ Do have faith in what you're doing.
沪ICP备16043287号-1