自己写了一个blog网站,博客首页会显示标题和文章摘要。所以现在的问题是如何能够比高效的生成文章摘要。
我现在是自己总结出一个摘要。另一个思路是显示文章的第一段,因为第一段内容一般是比较概括行的内容。
所以想问问,看看大家还有没有别的思路。
通过分析HTML的DOM,结合文章关键字标题等信息来对文章段落进行评分。
这个应该不是程序的问题,自然语言处理的范畴。难度太高了吧。最简单实现就是文章结构良好的,取首段。
正文完
自己写了一个blog网站,博客首页会显示标题和文章摘要。所以现在的问题是如何能够比高效的生成文章摘要。
我现在是自己总结出一个摘要。另一个思路是显示文章的第一段,因为第一段内容一般是比较概括行的内容。
所以想问问,看看大家还有没有别的思路。
通过分析HTML的DOM,结合文章关键字标题等信息来对文章段落进行评分。
这个应该不是程序的问题,自然语言处理的范畴。难度太高了吧。最简单实现就是文章结构良好的,取首段。