Datawhale零基础入门NLP赛事-LUV

1.读取数据集
Datawhale零基础入门NLP赛事-LUV

2.每个句子平均由1035个字符构成,最短的长度为51,最长的长度为5844。

Datawhale零基础入门NLP赛事-LUV
绘制直方图
Datawhale零基础入门NLP赛事-LUV
3.绘制直方图
Datawhale零基础入门NLP赛事-LUV
从统计结果可以看出,数据集类别分布存在较为不均匀的情况。在训练集中科技类新闻最多,其次是股票类新闻,最少的新闻是星座新闻。

相关文章:

  • 2021-10-29
  • 2021-10-11
  • 2022-01-03
  • 2021-11-26
  • 2021-05-24
  • 2021-10-20
  • 2021-09-25
  • 2021-08-10
猜你喜欢
  • 2021-07-23
  • 2021-05-18
  • 2021-08-01
  • 2021-09-15
相关资源
相似解决方案