【发布时间】:2021-12-24 13:39:56
【问题描述】:
谁能简单地列出为第一个项目的 CS 新手构建 BERT 文本分类器所涉及的任务?我的方法是获取一个段落长度的人道主义援助活动描述列表(在 CSV 文件中具有相应的标题和部门代码),并使用单独的部门代码列表及其句子长描述构建一个能够将部门代码分配给描述的分类器。对于训练、测试和评估,我会将分类器生成的代码与 CSV 文件中的代码进行比较。
对帮助我制定项目任务清单所涉及的高级任务/步骤有什么想法吗?我启动了一个谷歌 CoLab 笔记本,制作了两个 CSV 文件,将它们放在谷歌云存储桶中,我想我必须提取文件,标记数据,然后?理想情况下,我也想坚持使用 Google 工具。
【问题讨论】:
-
这样的一般问题最好通过博客文章或教程来回答。我建议从那里开始,如果您有与编程错误相关的狭窄、具体的问题,请再回来
-
请注意:作为计算机科学的第一个项目,与 Bert 一起进行机器学习是非常雄心勃勃的。假设您想了解自己在做什么,则需要获取大量背景知识。我建议从更简单的开始。通常 SO 也适用于编程问题,而您的问题是关于项目的完整设计。如果您可以更具体地提出问题,我建议您改用datascience.stackexchange.com 提问。
-
感谢您的意见。
标签: python google-colaboratory text-classification bert-language-model