WP-AutoPost是最好的WordPress自动收藏发布插件。它最大的特点是可以收集任何网站的内容,并自动发布到你的WordPress站点。
与其他大多数WordPress收藏插件不同,它只能根据提要进行收藏。使用饲料收集有很大的缺点。首先,您必须找到全文提要。但是网上的全文提要很少,大部分只能收集文章摘要。即使是使用提要收集文章摘要,也需要点击链接才能查看原文,相当于做了一个其他网站的外部链接。
在英文垃圾站广泛使用的WP-Robot,收集来源只有20个,物品来源也比较单一和有限。
而WP-AutoPost没有上述缺点,可以真正的收集任何网站的内容并自动发布。收集过程是完全自动的,无需人工干预,它提供了内容过滤、HTML标签过滤、关键字替换、自动链接、自动标记、自动将远程图片下载到本地服务器、自动添加文章前缀和后缀,以及使用微软翻译引擎将收集的文章自动翻译成各种语言以供发布。
WP-AutoPost中文免费下载地址:https://www.xuewangzhan.net/cj/11379.html(官网地址:http://wp-autopost.org/zh)
一、安装WP-自动发布
就像安装其他WordPress插件一样,可以直接上传到插件目录,激活后即可使用,无需额外设置或修改代码。
其次,创建一个收集任务
单击“新建任务”并输入任务名称以创建新任务。创建新任务后,您可以在任务列表中查看该任务,并且可以为该任务设置更多设置。
三。基本设置功能
在基本设置选项卡下,可以进行以下设置:
任务名称:可以修改任务名称类别:该任务收集的文章发布的类别:该任务收集的文章的发布作者必须是WordPress中的注册用户。更新间隔:多久检查一次该收藏任务下是否有可以更新字符集的新文章:收藏目标网站的字符集代码默认为UTF8。如果目标网页的字符集代码不是UTF8,那么抓取的网页就会出现乱码,设置正确的字符集就可以解决这个问题(如何正确设置字符集)。下载远程图片:如果该任务下收藏的文章包含图片,可以选择是否将远程图片下载到本地服务器,还可以进一步选择是否将下载的图片信息保存在WordPress媒体库中。自动标记:选择是否使用自动标记列表。使用自动标记后,如果文章包含列表中的关键字,标记将自动添加以匹配完整的单词。此设置适用于英语文章。
四、文章来源设置
在这个标签页下,我们需要设置文章来源的文章列表的URL以及具体文章的匹配规则。
我们以“新浪网讯”的收藏为例。文章列表的网址是http://roll . tech . Sina . com . cn/internet _ world list/index . shtml,所以在手工指定的文章列表网址中输入这个网址即可,如下图:
之后需要在文章列表URL下设置具体文章URL的匹配规则。
相关:WordPress教程
五、文章URL匹配规则
URL匹配规则的设置非常简单,不需要复杂的设置。提供了两种匹配模式,可以通过URL通配符或CSS选择器进行匹配。通常,通过URL通配符进行匹配更简单。
1.使用URL通配符匹配
通过点击列表URL http://roll . tech . Sina . com . cn/internet _ world list/index . shtml上的文章,我们可以发现每篇文章的URL具有以下结构
http://tech.sina.com.cn/i/2013-06-27/16328485884.shtml
因此,只需将URL中更改过的数字或字母替换为通配符(*),如:http://tech . Sina . com . cn/I/(*)/(*)。shtml
2.使用CSS选择器进行匹配
使用CSS选择器进行匹配,我们只需要设置文章URL的CSS选择器(如果你不知道CSS选择器是什么,一分钟学会如何设置)。通过查看http://roll . tech . Sina . com . cn/internet _ world list/index . shtml的源代码,列表URL,在列表URL下找到具体文章的超链接代码,就可以轻松设置,如下图:
如你所见,文章的超链接A标签在带有类“contList”的标签内,所以文章URL的CSS选择器只需要设置为。控制列表a,如下所示:
设置完成后,如果不知道设置是否正确,可以点击上图中的测试按钮。如果设置正确,将会列出列表URL下的所有文章名称和对应的网址,如下所示:
不及物动词文章捕获设置
在这个选项卡下,我们需要设置文章标题和文章内容之间的匹配规则。有两种设置方法。推荐CSS选择器,更简单更准确。(不知道CSS选择器是什么,一分钟学会如何设置CSS选择器)
我们只需要设置文章标题CSS选择器和文章内容CSS选择器,就可以准确的抓取文章标题和内容。
在文章来源设置上,我们以“新浪网络新闻”的集合为例。这里,我们就用这个例子来解释一下。你可以通过查看列表URL http://roll . tech . Sina . com . cn/internet _ world list/index . shtml下的一篇文章的源代码来轻松设置,比如我们看一篇具体文章http://tech.sina.com.cn/n/i/2013-06-10/06308430630.shtml,的源代码如下图:
可以看到,文章标题在id为“ArtibodyItle”的标签内,所以文章标题CSS选择器只需要设置为# ArtibodyItle
同样,找到文章内容的相关代码:
如您所见,文章内容位于id为“artibody”的标记内,因此文章内容CSS选择器只需设置为# artibody如下所示:
设置后,如果不知道设置是否正确,可以点击测试按钮,输入测试地址。如果设置正确,会显示文章的标题和内容,方便检查设置。
七。抓住文章的页码。
如果一篇文章的内容太长,也可以通过多次分页来抓取全部内容。这时,你需要为文章的分页链接设置CSS选择器。通过查看具体文章URL的源代码,您可以找到分页链接。例如,一篇文章的分页链接代码如下:
正如您所看到的,分页链接A标签位于带有“page-link”类的标签内
因此,文章分页链接CSS选择器可以设置为page-link a,如下所示:
如果您在发布时选中分页,则发布的文章也将被分页。如果你的WordPress主题不支持<!-–下一页–-& gt;标签,请不要检查。
八、文章内容过滤功能
内容过滤功能,可以过滤掉不想要的内容(如广告代码、版权信息等。)在文中。您可以设置两个关键字,并删除两个关键字之间的内容。关键字2可以为空,表示删除关键字1之后的所有内容。
如下图,我们通过测试抓取文章后,发现文章中有不想发布的内容,切换到HTML显示,找到内容的HTML代码,设置两个关键字过滤掉内容。
如果需要过滤掉多个内容,可以添加多组设置。
九。HTML标签过滤功能
HTML标签过滤功能,可以过滤掉收藏文章中的超链接(比如一个标签)。
评论前必须登录!
注册