【发布时间】:2019-01-30 20:34:51
【问题描述】:
我是正则表达式的新手。
我有一个 PHP 代码,可以从 PDF 文件中提取所有文本并存储在字符串变量中。
我需要获取第 2 页上的特定段落。我正在尝试使用正则表达式来获取文本直到句点,但问题是这一段中有很多句点,而正则表达式只匹配第一句。
我需要获取所有在右侧对齐的段落。所有这些都以“AGRAVO DE EXCECUÇÃO PENAL”这句话开头。但结局因人而异。
这是字符串变量值的样子(我需要的部分是粗体):
“PODER JUDICIÁRIO
圣保罗州司法法庭
13ª CâMARA DE DIREITO CRIMINAL
AGRAVO DE EXECUçãO PENAL Nº 000000000000 - VOTO Nº 0000 2
VOTO Nº 00000
AGRAVO DE EXECUçãO PENAL Nº 0000000000000000000
AGRAVANTE: MINISTéRIO PúBLICO DO ESTADO DE SãO PAULO
AGRAVADA:名称
AGRAVO DE EXECUÇãO Penal EXECUçãO CRIMINAL PLEITO DE MANUTENçãO DO CARáTER HEDIONDO DO CRIME DE TRáFICO PRIVILEGIADO,FIM DE MODIFICAR OS CáLCULOS NOVO ENTENDIMENTO DO C. STF EXTERNDO NO JULGAMENTO DO HC Nº 118.533/MS, NO SENTIDO DE AFASTAR A NATUREZA HEDIONDA DO TRáFICO PRIVILEGIADO DE DROGAS DECISãO DO JUíZO EM CONSONâNCIA COM O ENTENDIMENTO ESPECíFICO DO PLENáRIO DO C. STF, QUE Há DE PREVALECER AGRAVO NãO PROVIDO。
CUIDA-SE DE AGRAVO DE EXECUçãO Penal INTERPOSTO PELO M IN IS TÉR IO P Ú BLIC O D O E ST A D E S Ú O P A ULO CONTRA DECISãO PROFERIDA PELO JUíZO DO DEECRIM DA 6ª RAJ (COMARCA DE RIBEIRãO PRETO), QUE INDEFERIU PEDIDO DE RETIFICAçã"
【问题讨论】:
-
您可以发布您的 pdf 数据的文本版本吗?
-
@PushpeshKumarRajwanshi 好的,刚刚进行了编辑