公司网站制作获取详细信息页具体内容
发布时间:2025-05-09 14:23:08
由于不同信息类型会有不同的小标题,因此提取内容时,用if先进行判断有无该小标题,若有,则将内容赋值,若无,则将该小标题赋空值,防止因为无法找到该小标题,从而影响整页文书的爬取。
获取详细信息页具体内容。详细信息页主要分成两部分:基础信息和其他信息。由于不同信息类型会有不同的小标题,因此提取内容时,用if先进行判断有无该小标题,若有,则将内容赋值,若无,则将该小标题赋空值,防止因为无法找到该小标题,从而影响整页文书的爬取。 基础信息都在fullJudgement下面,直接提取出来即可,并放入Basic_Information列表中。 其他信息是在fullJudgement下面的paragraphs下面,所以要先将paragraphs提取出来,再一一将其他小标题提取出来,再放入Document_body列表中。
本文所属tags
版权声明
与本文相关的文章
无相关信息