封面

【开源】网页内容提取器

https://github.com/Amoyens1s/web-content-extract

https://www.npmjs.com/package/web-content-extract


分享下我的新开源项目,web-content-extract,基于Mozilla Readability,能提取网页正文内容并转换为Markdown。支持CLI和库两种使用方式,可同时获取SEO元数据,实现网页内容结构化提取,适合做信息聚合、知识管理等场景

技术栈为typescript

发布评论
全部评论(7)
avatar

好东西喵

avatar
qqqqqwww12_#1074949

[s-7]

avatar
棍母#1073926

有用[s-7]

avatar
大萨达#1073897

可以在gitee开源

avatar
五月病#1073865

收藏了喵