【问题标题】:Restore missing vowels in an array of words恢复单词数组中缺失的元音
【发布时间】:2021-05-27 12:26:36
【问题描述】:

我有一系列项目描述,其中许多已经从某些单词中删除了一些元音。使用 javascript 替换它们的最佳方法是什么?

这里有很多关于如何删除元音的答案,但我找不到任何关于如何恢复它们的信息?

完全准确不是必需的,最好的猜测就足够了吗?

【问题讨论】:

  • 为您添加深度学习相关标签。由于没有上下文无法知道dck 代表duckdeck

标签: javascript deep-learning neural-network nlp


【解决方案1】:

我不知道有任何现成的解决方案,但您可以轻松地自己训练神经网络。

这可以表述为一个序列标记问题。您需要用一个标志标记序列中的每个字符,告诉该字符后应该添加哪个元音(或最终不添加)。

您可以轻松地为该任务准备合成训练数据:只需获取任何英文文本,随机删除元音并动态生成基本事实标签。一个合适的架构是一个轻量级的双向 LSTM(我猜 64 个隐藏单元就足够了),顶部有一个简单的分类器。

在 JavaScript 中创建模型的最简单方法是在 Python 中在 TensorFlow 中训练模型,然后使用convert the model TensorFlow.js

【讨论】:

  • 好的 - 我有一些阅读和研究。谢谢 :) 很难知道从哪里开始学习 ML 的东西,但这似乎是一个很好的入门问题。再次感谢您的指导!
猜你喜欢
  • 2021-10-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-07-12
相关资源
最近更新 更多