【发布时间】:2023-03-14 03:23:01
【问题描述】:
我正在为地址训练一个文本分类器,以便给定句子是否是地址。
Sentence examples :-
(1) Mirdiff City Centre, DUBAI United Arab Emirates
(2) Ultron Inc. <numb> Toledo Beach Rd #1189 La Salle, MI <numb>
(3) Avenger - HEAD OFFICE P.O. Box <numb> India
由于地址可以有 n 种类型,因此很难制作这样的分类器。是否有任何用于相同或任何其他非 ML 方式的预训练模型或数据库。
【问题讨论】:
-
您是想对某物是否具有地址形式(例如
42 wallaby way Sydney)进行分类,或者该地址是否真的存在于现实世界中? -
真实存在的实际地址
-
看看
https://smartystreets.com/articles/does-google-parse-standardize. -
您有需要分类的数据集吗?如果您可以将它(或至少部分)上传到某个地方,我们会更好地了解我们正在处理的数据类型。我们还可以测试我们提出的方法的准确性。
标签: python machine-learning keras deep-learning text-classification