前言
本博客记录一下用bert模型进行中文文本分类的实战经历
一、文件目录构成
二、数据集构成
训练集9000条,验证集1500条,测试集1500条,在run_classifier.py中修改自己的数据集读入方式
标签及正负样本构成如下:
读入标签:
三、训练与测试代码
train.sh do_train=true,模型保存在tmp/sim_model
predict.sh do_predict=true
四、训练和测试过程与效果
训练1800轮准确度达到93%,loss23%
测试效果: