金融界2025年8月5日消息,国家知识产权局信息显示,深圳市国民大健康文化传播有限公司申请一项名为“基于大语言模型的文本信息结构化恢复方法、系统及应用”的专利,公开号CN120409443A,申请日期为2025年04月。
专利摘要显示,本发明提出了基于大语言模型的文本信息结构化恢复方法、系统及应用,包括以下步骤:S1,从网页或非结构化文档提取原始文本内容;S2,根据不同场景和目标结构,设计提示词模板,生成提示词;S3,引导大语言模型对步骤S2所述原始文本内容和所述提示词进行解析,生成具备层次结构的文本结果;S4,解析步骤S3的文本结果,构建语义结构树,形成多层嵌套结构;S5,将步骤S4所述多层嵌套结构用于数据库建模和内容索引,相比现有技术结构丢失不统一、通用性差和语义理解智能性缺失的不足,可显著降低人工处理成本,提升数据结构化效率与准确性,为大模型生态系统提供稳定、高质量的结构化文本支撑。
天眼查资料显示,深圳市国民大健康文化传播有限公司,成立于2013年,位于深圳市,是一家以从事文化艺术业为主的企业。企业注册资本100万人民币。通过天眼查大数据分析,深圳市国民大健康文化传播有限公司共对外投资了5家企业,财产线索方面有商标信息169条,专利信息3条,此外企业还拥有行政许可4个。