在线刊号(2320-9801)印刷刊号(2320-9798)
从波兰语文本中提取事实
波兰语在许多方面不同于英语。它有更复杂的共轭和赤纬。因此,从文本中自动提取事实是很困难的。在本文中,我们将介绍这些语言之间的基本区别。本文提出了一种从波兰维基百科文章中提取事实的算法。该算法基于在分析文本中搜索的7个提出的事实方案。分析包括形态句法标记、命名实体提取和关系识别。本文介绍了为示例性维基百科文本获得的结果。我们指出自由构词原则是波兰语篇分析的主要难点。同时,在所进行的实验中证实了标记和分析工具对波兰语的满意性能。
Tomasz boizynski, Adam Brzeski
阅读全文下载全文|访问全文