标签 词焙 下的文章

问题出现

在做词焙词库更新的时候遇到一个问题:如果某一个单词是一个非法的单词,那就需要进行标记,之后再次遇到的时候可以直接跳过。

这个方案要实现的话,可能第一时间会想到用 Redis 的 Set;或者数据库里加一张表,一行一个非法单词。

但是词焙本身是没有用到 Redis 的,如果要用还得配置下内存淘汰策略;这么简单的需求放数据库的话又有点杀鸡用牛刀了。

所以我选择了直接使用内存 + 定期持久化到文件,整个技术方案不难,加起来就一百行左右的代码。

- 阅读剩余部分 -

最近一个月(2025.06.19~07.18)输入跟输出各占一半吧,输入主要是把过去的一些东西复盘了一下,然后找资料,对旧东西有了新的认识,输出主要还是词焙相关的优化工作:

开发

  • 词焙新增了用户个人设置同步,新增了发音偏好:「国际音标」和「近似发音」,近似发音类似于小时候学英语写的谐音,不过用的是简短的英语单词,例如 wordsbaking 的近似发音是 wurds·bay·king,对于不想看音标的懒人来说是一种记发音的友好方式了吧🤣
  • 为了做划词翻译插件,优化了下 AI 翻译单词的队列,现在可以并发处理了(其实就是申请了多几个 API key,防止单个 key 超 rate limit)

其他

  • 申请了腾讯云 EdgeOne CDN,也体验了一把 EdgeOne Pages,托管了个开源小游戏,点此体验:TapMe小游戏合集
  • 重装了一台闲置的服务器

文章

写了两篇新文章,其中一篇是之前说好要写的两篇之一(还剩一篇迟点写):