关于精确统计你的词汇量/单词量,我有一个也许有趣的想法

2017-12-12 19:40:31 +08:00
 Aether
搜索“精确统计词汇量”,大多都是“词汇量测试”,或者“如何提高词汇量”这种。但这都不是我感兴趣的。

我最感兴趣的还是:“我的词汇量到底有多少?”
我感到,现在还没有一个工具里可以认真严肃地做到这一点。

所以我计划开发一个软件(第一期包括 WEB 和 iOS )实现以下的思路:
1、粘贴输入一段文本,或者通过 URL 抓取正文;
2、点击你不认识的单词,标记为“不认识”;
3、读完以后,将剩下的提交为“已认识”。

经过一些阅读训练之后,可以越来越精确地反馈你的真实词汇量。

我已经做好了一个 DEMO。通过大约 10-12 篇的单词,帮助我清理出 3000 个已知单词,也让我记住了不少新单词。立马能想起来的比如,fir,来自一篇讲述小兔子的历险记。outright,来自一首著名的诗。还有不少虽然说不出来,但是看见以后能马上想起来。因为这些单词都和一个故事 /场景牢固地绑定起来,形成了更为强烈的情感连接。

下面是 DEMO 的一个示例界面:


下面是我的一个阅读界面,展示了我读完以后的状态:
(对,有些害羞,我的确头一次发现,我可以读完《卖火柴的小女孩》的原文。不一样的感受。)


我自己的感觉是,一个人的认知能力是有限的。因为受到生词的影响,阅读时的“认知力”被分流了。而一旦有一个辅助系统来接管“生词”这件事,无形中,“阅读力”似乎被提高了,使我可以更聚焦在阅读本身上面。(这只是我的个人猜测)。

此外,有了这些数据,我希望系统可以自动向我推荐适合阅读的文本(跳一跳就可以达到的,比如,5%-10%的生词量),然后通过反复曝光来提升我的阅读能力、语感和词汇量。

如果你对这个想法也感兴趣,请发给我一封邮件:aetherwu * gmail.com ,加入到我的测试列表。

这个想法对很多擅长阅读的大拿们显然是画蛇添足,若有打扰,还望忽略本帖。
对这个想法有其他想法或者批评的,也还望多多指教。
感谢。
6392 次点击
所在节点    奇思妙想
39 条回复
SkyeX
2017-12-12 19:56:39 +08:00
不错,不过读一篇文章,我不会的单词得提供翻译把?
zeanzhou
2017-12-12 20:39:43 +08:00
感觉蛮有意思的,应该会有用
之前用百词斩背过单词,他会提供一些图片和对应的例句辅助记忆,不过其实有时候我觉得他给的图片和例句还是蛮牵强的,不如在文章里看到来的印象深刻,高中的词汇量完全是做阅读做出来的 hh
SuperMild
2017-12-12 20:56:38 +08:00
good idea !
mkstring
2017-12-12 20:59:51 +08:00
good idea !
Aether
2017-12-12 22:09:39 +08:00
@SkyeX 会的,点击一下就在底部浮动出翻译面板。
@zeanzhou 对,我也用过百词斩。但弱场景的很快就忘了。
sharkli
2017-12-12 22:12:23 +08:00
我不在意自己的单词量。
通过你这个方式 能以后自动帮我把文章里面我可能不认识的单词标记出来,加上释义会比较有用。
Aether
2017-12-12 22:48:58 +08:00
@sharkli 对,这也是初衷之一。
codermagefox
2017-12-12 22:55:06 +08:00
主意很棒,赞一个。就是很奇怪为啥今天才有人想到...这个需求和做法应该已经十多年了?
xml123
2017-12-12 22:55:52 +08:00
有安卓版吗
huijian222
2017-12-12 23:26:41 +08:00
第一:用户是否有耐心能读完这么多篇,如果有 业界是否有更有效的检测方式。
第二:KINDLE 的生词本和辅助外语习得能力跟你的描述非常接近。
solobat
2017-12-13 00:13:02 +08:00
Chrome 里有这样的扩展,叫「单词发现者」。就是用户可以划定一个单词范围,比如 4000 以外的词汇都标出来。一开始我也觉得有意思,后来用着发现,对生词的识别需要先将单词还原成原形态,比如去掉复数、过去式、进行时等等,不然换了一种形式,原来的熟词又会被标成生词,这就尴尬了。还原单词形态这个,貌似是难点。
YvesX
2017-12-13 01:57:24 +08:00
已经有很多外语阅读材料学习 app 了,你的想法适合做成其中一部分。单独拎出来好像不是很有必要。
WildCat
2017-12-13 02:16:27 +08:00
不错,配合机器学习或者 word embedding 可能可以更有趣。
CommitOne
2017-12-13 08:13:51 +08:00
感觉可以啊,期待成品,上面说的时态变化的问题确实,不过有的词典不是有时态变化吗?
nameryan
2017-12-13 09:24:50 +08:00
不错的 idea,感觉和时下流行的人工智能机器学习结合起来可能更有噱头,但实际应用场景有点局限,可能可以作为英语评测机构的一种方法?或者还有其他推广的场景? 暂时好像还想不到。
dday
2017-12-13 09:28:19 +08:00
顶,已发邮件~
Macbooker
2017-12-13 09:31:38 +08:00
@codermagefox 难道现在市面上测单词量的不是抽样?测越多肯定越准,但太多也没意义,知道个大概水平就够了。
最准的当然是拿一个词典挨个测
sephrioth
2017-12-13 09:42:48 +08:00
手动赞!
minamike
2017-12-13 10:04:10 +08:00
扇贝阅读?
beball
2017-12-13 10:43:15 +08:00
不错的计划,已发邮件

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/414180

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX