写文章
蜘蛛侠太阳能采购和LED贸易
2015-07-25 00:18

Google Analytics中垃圾引荐来源的处理

大概不少朋友都被GA数据分析里面,流量来源中,引荐里面的一些数据所困惑,会发现怎么自己的网站有很多流量是来自一些自己根本没去发过外链的站点,比如下面这些来源:

floating-share-buttons.com
site1.floating-share-buttons.com
site2.floating-share-buttons.com
site3.floating-share-buttons.com
http://www.event-tracking.com
social-buttons.com
buttons-for-website.com
buttons-for-your-website.com
videos-for-your-business.com
success-seo.com
semaltmedia.com

等等。

我也被困惑了,由于是新站,其他流量来源比较少,这些引荐流量竟然是占了相当一部分比例。所以着手研究了一下。

原来这些都叫垃圾引荐(Referrer Spam ),他们通常会不定期但是比较频繁的访问你的网站,他们访问你的网站并不是对你的内容感兴趣,更不是人为的再访问,全部是脚本自动在执行。它们只是单纯来访问一些你的网站,然后里面就走,甚至不到半秒钟,为了只是在你这里留下痕迹(access log),当Google爬虫或者GA来到你的站点的时候,就会发现这些痕迹并顺着爬过去,起到给它们的站点带去关注度的作用,为的是推广他们的网站,以获得更好的排名。这也是黑帽SEO的一种流行做法。

这些垃圾来源一般不会影响你网站的性能,也不影响你的排名。但是还是有很大的坏处,一是并不真的对你站点感兴趣,所以跳出率和PV很高,二是会占你网站一定的带宽,三就是混淆你GA里面的数据,增加你分析的难度。

这些垃圾分2种,一种叫Ghost Spam,一种叫Crawler Referrer Spam。

Ghost Spam主要包含下面这些站点:
floating-share-buttons.com|e-buyeasy.com|wpsecuritycheck.co.uk|wpthemedetector.co.uk|erot.co|webmonetizer.net|howtostopreferralspam.eu|trafficmonetizer.org|wpsecuritycheck.co.uk|wpthemedetector.co.uk|trafficmonetize.org|websites-reviews.com|sanjosestartups.com|4webmasters.org|http://www.event-tracking.com|webmaster-traffic.com|torture.ml|amanda-porn.ga|generalporn.org|depositfiles-porn.ga|youporn-forum.ga|rapidgator-porn.ga|meendo-free-traffic.ga|buy-cheap-online.info|http://www.Get-Free-Traffic-Now.com|googlsucks.com|simple-share-buttons.com|social-buttons.com|o-o-8-o-o.com|humanorightswatch.org|o-o-6-o-o.com|bestwebsitesawards.com|hulfingtonpost.com|ilovevitaly.com|blackhatworth.com

这些站点根本不访问你的网站,它是通过一个单独的协议向GA发送数据,表示来过你的站点。这样的站点,跳出率几乎是100%,PV几乎就是1甚至0。

Crawler Referrer Spam主要包含下面这些站点:
buttons-for-website.com
buttons-for-your-website.com
videos-for-your-business.com
success-seo.com
semaltmedia.com
dailyrank.net
sitevaluation.org
100dollars-seo.com
forum69.info
best-seo-solution.com
best-seo-offer.com
semalt.semalt.com
semalt.com
7makemoneyonline.com
anticrawler.org
baixar-musicas-gratis.com
descargar-musica-gratis.net

这些站点类似爬虫,像Google和百度的爬虫,但是这些爬虫不会看你的robots文件,不管什么内容,它就是来访问一下,刷存在感。

对于Ghost Spam,由于它并没有真正访问我们的网站,所以试图在服务器端去阻止它们是徒劳的(比如编辑.htaccess文件以阻止他们)。我们可以通过在GA里面创建一个全局的过滤器来过滤那些数据。

简单来说就是在GA界面,点击管理(Admin),再做右侧的视图(View),过滤器(Filters),新建过滤器,给过滤器命名,过滤器类型选择自定义(Custom), Exclude, Filter Field选择Campaign Source,Filter Pattern里面输入你要过滤的域名,比如floating-share-buttons.com,或者如果你过滤多个域名,就用|隔开,floating-share-buttons.com|e-buyeasy.com,中间没有任何空格和标点符号。每个过滤器的条件只能容纳255个字符,所以如果你要过滤很多,就得添加多个过滤器,比如我就添加了3个。在下方有个Filter Verification过滤器验证,可以点击验证一下,它会给你展示过滤前和过滤后的数据对比。如果无法验证,应该是上面过滤器的格式出了问题。建议先只添加一个域名试试,没问题再添加多个域名。然后保存就可以了。

这个过滤器只会在未来过滤那些垃圾引荐流量,无法改变历史数据。

对于Crawler Referrer Spam,你也可以采取上面的方式,在GA里面添加过滤器来过滤。但是既然它会实实在在访问我们的网站,我更倾向于在服务器端去彻底阻止它,对于WP建站来说就是编辑.htaccess文件。

简单来说,就是把下面这段代码添加到.htaccess文件里面。你想改动也可以,但是千万注意格式和细节,多一个字母少一个字母都不行。我刚开始因为复制粘贴,多了2个字母,结果导致整站无法访问。而且编辑现有.htaccess文件之前一定要做好这个文件的备份。总之,任何情况下操作.htaccess文件,慎之又慎。

# STOP CRAWLER SPAM
RewriteCond %{HTTP_REFERER} buttons\-for\-website\.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons\-for\-your\-website\.com [NC,OR]
RewriteCond %{HTTP_REFERER} videos\-for\-your\-business\.com [NC,OR]
RewriteCond %{HTTP_REFERER} success\-seo\.com [NC,OR]
RewriteCond %{HTTP_REFERER} semaltmedia\.com [NC,OR]
RewriteCond %{HTTP_REFERER} dailyrank\.net [NC,OR]
RewriteCond %{HTTP_REFERER} sitevaluation\.org [NC,OR]
RewriteCond %{HTTP_REFERER} 100dollars\-seo\.com [NC,OR]
RewriteCond %{HTTP_REFERER} forum69\.info [NC,OR]
RewriteCond %{HTTP_REFERER} best\-seo\-solution\.com [NC,OR]
RewriteCond %{HTTP_REFERER} best\-seo\-offer\.com [NC,OR]
RewriteCond %{HTTP_REFERER} semalt\.semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} 7makemoneyonline\.com [NC,OR]
RewriteCond %{HTTP_REFERER} anticrawler\.org [NC,OR]
RewriteCond %{HTTP_REFERER} baixar\-musicas\-gratis\.com [NC,OR]
RewriteCond %{HTTP_REFERER} descargar\-musica\-gratis\.net [NC]
RewriteRule .* - [F]

上面的办法都是在将来阻止这些垃圾引荐,有朋友也许想问我想在历史数据里面也过滤掉这些数据怎么办。我们用细分这个功能。

简单来说,进入到GA里面报告首页,流量获取(Acquisition),所有流量(All Traffic),渠道(Channels),进入到引荐(Referrals)页面,在页面顶端点击添加细分(+Add Segment),New Segment,命个名字,点击Advanced下的Conditions,过滤器设置为Exclude,再将Ad Content改为Medium,contains改为exactly matches,文本框填写referral,再AND一个条件,Ad Content改为Source,contains改为matches regex,文本框的内容就和过滤器里面一样了,比如floating-share-buttons.com|site3.floating-share-buttons.com|site1.floating-share-buttons.com|site2.floating-share-buttons.com|site4.floating-share-buttons.com|http://www.event-tracking.com|free-social-buttons.com|www1.free-social-buttons.com。

大概就这样吧,想再深入细节了解的可以自己Google学习。

这个点儿发帖不容易,求点赞。

关注作者,看更多TA的好文章 个人展示
蜘蛛侠太阳能采购和LED贸易 谁在评论里提醒下这位作者,懒得连名片都没填写。
举报
收藏
转发
0/500
添加表情
评论
评论 (45)
最近
最早
3天2夜学会建站

蜘蛛侠太阳能采购和LED贸易

目前做两件事: 1. 欧洲太阳能公司采购,采购一切太阳能相关产品。电池,太阳能板,电视,冰箱,风扇等等。 2. LED贸易,室内/户外照明类产品。 擅长销售,互联网营销,采购。

向TA提问
置顶时间 :

设置帖子类型

普通
新闻
活动
修改

圈内转发

0/104

分享至微信

复制链接

举报

请选择举报理由

留联系方式
垃圾广告
人身攻击
侵权抄袭
违法信息
举报

确认要删除自己的评论吗?

取消 确定

确认要删除自己的文章吗?

取消 确定
提问
设置提问积分
当前可用积分:
-
+
20
50
100
200
偷看

积分偷看

10积分
我的积分(可用积分)
确认偷看

问题已关注

答主回复后,系统将通知你

不再提示