编号
zgly0000743683
文献类型
期刊论文
文献题名
基于语义的林产品贸易文本信息结构化研究
学科分类
220.65;林业经济学
作者单位
北京林业大学信息学院信息管理系
母体文献
计算机工程
年卷期
2011,37(20)
页码
261-263
年份
2011
分类号
TP391
关键词
语义
林产品
贸易文本信息
结构化
信息抽取
识别规则
文摘内容
根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用创建数据库和数据表匹配识别规则,给出识别规则匹配的正则表达式和文本内容截取识别规则,以抽取需要的特定事实信息,并以一种结构化的形式存储于数据库中。通过对实际林产品贸易网站的文本信息结构化抽取,证明该研究在林产品贸易信息推送中具有较好的应用价值。