【问题标题】:What is "Letter Distribution" and what is "Word Distribution" in NLP dataset while preforming Exploratory data analysis(EDA)在进行探索性数据分析(EDA)时,NLP 数据集中的“字母分布”和“单词分布”是什么
【发布时间】:2021-07-20 18:17:21
【问题描述】:

各位,我是数据分析师的新手,我正在努力提高我的技能,所以我从 kaggle 中获取了一个数据集。 these are task of the dataset 我被困在 EDA 的任务 3 和 4 上。任何人都可以帮助我解决这个问题以及我如何执行它。 [注意:这不是任何项目。我只是想提高我的工作技能]

【问题讨论】:

  • 请从intro tour 重复on topichow to ask。不接受站外链接和images of text;我们需要您的问题是独立的,以符合本网站的目的。
  • 另请参阅 homework 上的 Stack Overflow 指南。简单地把你的作业丢在这里是不可接受的,而且很可能违反了你学校的学术诚信政策。如果您不理解作业,通常的补救措施是请教老师。

标签: python database nlp data-science data-analysis


【解决方案1】:

他们希望您计算数据集中每个单词或字母的 #(实例)。

不过,这是 EDA 的一部分,所以我相信您并不一定需要这样做,它可能有助于确定进一步的分析途径。

【讨论】:

  • 你能告诉我如何执行它并从 2 天开始尝试,但我找不到,我可以分享我的数据集
  • 正如其他用户所提到的,请取得一些进展并提出更具体的问题,其中一些代码会突出显示您遇到的问题。
猜你喜欢
  • 1970-01-01
  • 2012-10-01
  • 1970-01-01
  • 2019-01-12
  • 2018-02-08
  • 2021-01-27
  • 2020-09-01
  • 1970-01-01
  • 2018-07-04
相关资源
最近更新 更多