关于精确统计你的词汇量/单词量,我有一个也许有趣的想法

2017-12-12 19:40:31 +08:00
 Aether
搜索“精确统计词汇量”,大多都是“词汇量测试”,或者“如何提高词汇量”这种。但这都不是我感兴趣的。

我最感兴趣的还是:“我的词汇量到底有多少?”
我感到,现在还没有一个工具里可以认真严肃地做到这一点。

所以我计划开发一个软件(第一期包括 WEB 和 iOS )实现以下的思路:
1、粘贴输入一段文本,或者通过 URL 抓取正文;
2、点击你不认识的单词,标记为“不认识”;
3、读完以后,将剩下的提交为“已认识”。

经过一些阅读训练之后,可以越来越精确地反馈你的真实词汇量。

我已经做好了一个 DEMO。通过大约 10-12 篇的单词,帮助我清理出 3000 个已知单词,也让我记住了不少新单词。立马能想起来的比如,fir,来自一篇讲述小兔子的历险记。outright,来自一首著名的诗。还有不少虽然说不出来,但是看见以后能马上想起来。因为这些单词都和一个故事 /场景牢固地绑定起来,形成了更为强烈的情感连接。

下面是 DEMO 的一个示例界面:


下面是我的一个阅读界面,展示了我读完以后的状态:
(对,有些害羞,我的确头一次发现,我可以读完《卖火柴的小女孩》的原文。不一样的感受。)


我自己的感觉是,一个人的认知能力是有限的。因为受到生词的影响,阅读时的“认知力”被分流了。而一旦有一个辅助系统来接管“生词”这件事,无形中,“阅读力”似乎被提高了,使我可以更聚焦在阅读本身上面。(这只是我的个人猜测)。

此外,有了这些数据,我希望系统可以自动向我推荐适合阅读的文本(跳一跳就可以达到的,比如,5%-10%的生词量),然后通过反复曝光来提升我的阅读能力、语感和词汇量。

如果你对这个想法也感兴趣,请发给我一封邮件:aetherwu * gmail.com ,加入到我的测试列表。

这个想法对很多擅长阅读的大拿们显然是画蛇添足,若有打扰,还望忽略本帖。
对这个想法有其他想法或者批评的,也还望多多指教。
感谢。
6392 次点击
所在节点    奇思妙想
39 条回复
chuanqirenwu
2017-12-13 10:43:24 +08:00
想法很好的,配合机器学习,人工智能,推荐系统,可以做很多 in 垂死听的事情。请问 web 版在哪? ios 版可以在 appstore 下到了么。
vipper
2017-12-14 07:51:48 +08:00
不错,已邮件
swx934
2017-12-14 16:34:53 +08:00
这个功能扇贝阅读就有了.
Tiakon
2017-12-17 02:16:41 +08:00
不错,已邮件
Damaidaner
2017-12-18 10:51:25 +08:00
不错,支持 LZ,期待正式上线!
zzj0311
2017-12-19 15:04:46 +08:00
意义在哪里。。扇贝刷个一万三四还能拿去吹个逼,能看懂不就行了~
Axurez
2017-12-21 16:05:12 +08:00
听起来很像我在做的一个东西……我写了一篇文章介绍 https://zhuanlan.zhihu.com/p/31874729
上线的地址在 https://www.eliseos.org/zh/babel/learn
Axurez
2017-12-21 16:10:38 +08:00
@sharkli 你可以试试我这个(信息在楼上)

目前只能严格标记认识、不认识的,没有推荐和联想。释义可以加,但是得自己加,可能可以考虑挂一个开源的词典(不知道有没有)。
Gothack
2017-12-21 18:25:11 +08:00
赞,已邮件
sharkli
2017-12-21 20:00:25 +08:00
@Axurez 多谢
javaluo
2017-12-21 22:07:12 +08:00
就是这个想法呀,苦于不会写程序
4396NeverBeSlave
2017-12-22 08:22:06 +08:00
想问下楼主有没有安卓版的?
tvallday
2017-12-25 01:46:10 +08:00
一个单词可以有很多种意思的。你以为你懂了某个单词,其实换一句话你就不懂了。最好不要以认识不认识来主观计算自己的词汇量。玩玩可以,但是不是很科学。
Aether
2018-01-02 12:55:52 +08:00
发送过邮件的各位朋友都已经加入到 TestFlight 了。
@dday
@Gothack
@Tiakon
@vipper
@dday
@beball


很抱歉现在还只是在实验这个想法,如果大家都觉得有趣,会做安卓版本的。
@4396NeverBeSlave
@xml123

对,之后的辅助方式可能是各式各样的。
@sharkli

对,有一点点难度,但应该不是很难,一定会做。
@solobat


我也不知道啊(捂脸,可能是太懒了……)
@codermagefox

对,很棒的网站!很开心原道有相同想法而且能手动实现的朋友:D
@Axurez
Aether
2018-01-02 12:56:58 +08:00
@tvallday 这里的认不认识并不是你是否背下了一个含义,而是看你在阅读过程里是否能理解这个单词的实际意思。如果看不懂肯定会点击查询一下。
jyf
2018-01-02 14:35:16 +08:00
网易有道以前就有个插件可以干这种事
jagger2048
2018-07-30 11:16:44 +08:00
想知道题主这个项目的后续发展如何。假设已经能够统计出用户较为精确的词汇量(项目的核心),要怎么通过这个获取而来的数据做文章?是做推荐阅读,还是单纯地提供一个接口供其他项目使用?
Aether
2018-07-30 11:41:36 +08:00
@jagger2048 推荐阅读对我来说现在还有点难度,属于技术树缺失。目前可能优先计划一个 Feed 阅读器……
Winner4good
2023-04-02 20:37:18 +08:00
项目还在做吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/414180

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX