【发布时间】:2020-07-21 20:14:40
【问题描述】:
我有一个包含 3 列的数据框:等价、类、通道。我正在使用 Python。
equivalences class ch
ETICA CONTABIL A ÉTICA CONTÁBIL 40.0
ETICA CONTABIL A ÉTICA CONTÁBIL COM ENFOQUE 40.0
BANCO DE DADOS GERENCIANDO SEU BD 40.0
AMBIENTE WEB APLICAÇÕES EM NUVENS 40.0
AMBIENTE WEB ALTA DISPONIBILIDADE 40.0
TECNOLOGIAS WEB PÁGINAS PARA INTERNET 40.0
TECNOLOGIAS WEB PROGRAMAÇÃO WEB AVANÇADA 40.0
TECNOLOGIAS WEB DESENVOLVENDO COM JS 40.0
None PROGRAMAÇÃO WEB 40.0
我需要得到等价的对组合,对这对的 ch 求和。应该是这样的:
equivalences class a class b ch
ETICA CONTABIL A ÉTICA CONTÁBIL A ÉTICA CONTÁBIL COM ENFOQUE 80.0
BANCO DE DADOS GERENCIANDO SEU BD (null) 40.0
AMBIENTE WEB APLICAÇÕES EM NUVENS ALTA DISPONIBILIDADE 80.0
TECNOLOGIAS WEB PÁGINAS PARA INTERNET PROGRAMAÇÃO WEB AVANÇADA 80.0
TECNOLOGIAS WEB PÁGINAS PARA INTERNET DESENVOLVENDO COM JS 80.0
TECNOLOGIAS WEB PROGRAMAÇÃO WEB AVANÇADA DESENVOLVENDO COM JS 80.0
(null) PROGRAMAÇÃO WEB (null) 40.0
我想我必须使用组合 itertools,但我不知道如何按等价分组以获得不同的对。 我该怎么做?
【问题讨论】:
-
最后一行和带有“BANCO DE DADOS”的行不是一对。这些案例的确切逻辑是什么?
-
最后一行和带有“BANCO DE DADOS”的行在a类+b类之间不等价。顺便说一句,这些情况可以排除。
-
已排除 - 您的意思是从结果中删除吗?
-
是的,它们并不重要,因为它们没有等价物。我想让他们在数据集中检查错误寄存器的情况,例如“技术 -1st períod” - “technologies” - “technologies -2nd”,这可能是相同的等价物,但我会在解决这个问题后处理这些情况第一部分
标签: python pandas combinations itertools