SEO简析: 拼途网(Pintour.com) URL结构分析

四月 1st, 2012 by cheegt

前言

Alexa排名在10W以内的站可以算的上是中大型站,那么什么是影响SEO流量的关键?不是关键词,不是页面META标签,也不是外链,是收录量,有效页面收录量,影响收录量的往往是由网站结构所决定的,SEO正是要将网站本身页面更多的推送给搜索引擎,而SE的抓取是可以控制的,把一切看起来不可控的因素变为可控,那么SEO自然到位。

Read the rest of this entry »

闲文一篇

二月 2nd, 2012 by cheegt

龙年,2012正月初十了。写2011年终总结似乎有些迟了,以往对着屏幕,酝酿片刻却酝不出一丝述意,有的只是尿意。

今天也是将我拖了近一个多月的决定实施的时候,那就是,辞职。是的,辞职,刚交完辞职函。HR问我为什么? 我说了句是时候了。

是的,Is the time。无关乎结果,早晚而已,就像一坨屎,早憋晚憋,即便是马桶也留不住它,它始终是要通过菊花落入马桶,穿过水管流入下水道的宿命一般。

原谅我的粗俗,世上本无雅人,矜持的久了自然就雅了。

记得去年是三月提的离职,似乎就在昨日。井底待的久了,小虫小鼠见得多了,终该是时候后蹦出去了,所以便蹦到了这里。

初入一片雾里朦胧,且见新枝初芽,含苞待放,顿感欣然,扑腾扑腾便蹦跶了好些路子,走得近处忽落一泥沼,荆棘横生,蛇虫蛛蚁,牛马鬼神,好不煞人。奈何身轻力小,便知若得清明必如同蜉蝣撼树一般不可力敌,唯挂一酱瓶,伏于清荷之上。有道是

春夏秋冬神鬼出,孤得酱瓶自欣然。

恕,好景不长,一日,忽闻沼中来一凶物,言传力大生猛,好不威风。奇也,孤身前往,却见那凶物满背毒瘤,张口吐风,一双牛铃大眼,四爪健硕,暗道一声好个黑蟾! 此蟾初临,便四处作歹,惹的沼中好不安生。

虽不惧,奈何其体健硕,却也不好捋其虎须,也就由着它去。不日,便有几番寻衅,惹得两目相憎,碍于沼中不便行险,遂,作罢。

闲逸无久,此蟾越发张狂,且与那沼中之主狼狈为奸,时不时将沼中搅的风起云荡,泥水乱飞。此主乃是一花斑大蛇,闲时隐于沼中,偶穿梭在青藤泥浆之间,捕得口食便隐得身去。

一日,黑蟾作威,触及逆鳞,孤奋抗之… 虽得一时之快,结苦果。此厮继扯蛇皮,作福作威,却仍奈其不得。

孤虽入沼时日不多,却看得清明,心中便已了然。

今日便是那去意了却之时。

个中趣闻轶事,不得细说,却也历历在目。

穿沼而行,诸位不必挂念,自有新径奇景,妙人清语在那桃花源中。

再会,2011!

ECMall 前期开发SEO需求概述

十月 26th, 2011 by cheegt

ECMALLECMall 社区电子商务系统(简称ECMall),是一个允许店铺加盟的多店系统。目前越来越多的电商创业公司都以开源系统入手建设项目,而ECMall在SEO方面许多地方都存问题,本次将从ECMall(2.2.1)的网站配置环境、结构层方面进行SEO分析,以便在后续的开发、运营中进行系统化的SEO部署。

ECMall 前期开发SEO需求简述

一、环境配置需求

1)、Gzip 压缩,基于Apache配置Gzip压缩(mod_deflate)。ECMall 配置文档有开启此项功能,前提是服务器环境支持开启Gzip;

商城根目录下:

data/inc.config.php

define(‘ENABLED_GZIP’,     0); // 是否开启GZIP,1为开启,0为关闭 将此项修改为define(‘ENABLED_GZIP’,     1); // 是否开启GZIP,1为开启,0为关闭

2)、网站日志,要求可提供为.log后缀的日志文件(每日数据)。目的是要得到Bot访问数据,抓取量、爬行路径等,以配合中后期SEO策略实施。

3)、404页面,制作友好的404页面,并返回正确状态码。请注意,目前很多网站很重视404页面,页面做的非常漂亮,返回的却是200状态码。HTTP状态码参考Google帮助

4)、页面编码定义,Charset=GBK,或者添加lang=zh-CN声明。

5)、URL重写,默认伪静态规则包括(商品,分类,品牌,文章,店铺,团购)页等。ECMall源文件中包含Apache 服务器以及IIS 服务器的URL Rewrite方法。

6)、规范301,带www和不带www的域名规范化。

 

二、页面结构需求

ECMall默认description是整站调用的(商品页除外),结构层中更多的是标签的使用规范,多适用于前端。从主要的article:文章页、goods:商品页、brand:品牌页、store:店铺页几个页面着手优化。

1)、article:文章页

META标签规范:

keywors标签为空或者删除;

文章页面包屑导航处“文章内容”改为内容标题;

description调用文章标题;

2)、goods:商品页

META标签规范:

keywords:XX商城,’商品名称(goods_name)’,'品牌(Brand)’,'商品标签(Tags)’

description:欢迎前来XX商城选购’商品名称(Goods_name)’,想了解更多’商品名(Goods_name)’,请进入’店主名称(Owner_name)’的’店铺名称(Store_name)’实力店铺,更多****,XX商城任你选购.

H标签规范:

商品详细页中商品名称统一使用H1

首页,分类页LOGO处使用H1

(商品详情 商品评价 销售记录 商品留言)使用H2

3)、brand:品牌页

全部品牌页:独立头部title、keywords、description

4)、store:店铺页

META标签规范:

keywords:XX商城,服饰批发店铺,’店主名(Owner_name)’,'店铺名称(Store_name)’

description:欢迎来到XX商城实力店铺’店主名(Owner_name)’的’店铺名称(Store_name)’,'店铺描述取160字节(description)’.

H标签规范:

店铺名称使用H1

(店铺推荐、新品上市)使用H2

(店铺搜索、产品分类、友情链接)使用H3

其余小标题使用H4

 

三、其他需求

环境配置需求中默认为整站为需求点,结构层中以重要的页面为主,ECMall中整站调用HEAD中的generator、copyright、author几个标签可改为自己网站信息或者删除。

1)、首页独立头部title、keywords、description标签

2)、面包屑导航中的”首页”改为”XX首页”,XX为网站名

3)、网站地图,制作面向用户的HTML以及供Bot抓取的XML版

4)、商品图片,商品图片alt属性调用商品名称,促销标语写入商品图片title标签。(为什么要这样做? alt和title用哪一个都无所谓是句不负责的话,后续更新一篇关于alt和title的区别。)

 

四、最后

ECMAll的SEO还有很大改进的地方,以上的一些需求点,基本都是需要技术来配合实施的,具体到应用还是要按照项目的需求、运营模式等来调整的。

想起一段话,关于SEO执行力:

The biggest obstacle for large companies around SEO is internal communication.围绕搜索引擎优化的最大的障碍是大公司内部沟通。

If you want people to do something, you have to explain the value of the activity to them.如果你希望人们做一些事情,你必须解释他们的活动的价值。

逃离Google补充材料

十月 25th, 2011 by cheegt

在Google搜索结果中除了列出网页的网页快照,类似网页以外,有时候Google还会把网页标志为补充材料。

可到目前为止,Google并没有太多信息告诉大家补充材料是怎么定义的。在Google自己的网站管理员指南中所给的官方信息是这样写的:

补充网站是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到我们的补充索引里。

将网站包括其中的索引是完全自动的,没有任何方式可以选择或更改您网站的索引。请放心,包含网站的索引不会影响该网站的PageRank。

实际的情况是,被标为补充材料的网页在Google搜索结果中一般都会被排在普通网页的后面,所以通常是找不到的。除非关键词是比较长,并且比较具体的时候,补充材料才会出现。

那么Google补充材料形成的原因是网页的Description写法不规范?

目前中文搜索结果里补充材料出现更多,不过与正常网页比,还是少数。

被标为补充材料的网页是在单独的数据库(补充索引)里,不是主索引数据库,在补充索引里的网页被爬行的次数会减少,网页快照的日期也通常都是很旧的。

如果你的网站有很多网页被标为补充材料,在绝大部分情况下都不是什么好事。因为只有在普通结果不够的时候,被标为补充材料的网页才会出现在搜索结果中,自然对网页的排名有很大影响。

被标为补充材料的网页,通常有下面几种情况:

  1. 有网址规范化问题。也就是带有www和没有www的两个网址版本都在数据库中,那么其中一个就有可能被标为补充材料。
  2. 有时候已经被删除的网页,也就是实际上应该返回404错误的URL,会被列为补充材料。或者域名已经过期了,也有时会被标成补充材料。
  3. 有时候在改动网页之后,新旧内容的两个版本的网页都会出现在Google索引中。而糟糕的是,其中一个会被标为补充材料。
  4. 复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。
  5. 网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。

从上面这几种情况来看,补充材料在大部分情况下和网页内容重复或类似有关。

如果你的网页被标志成补充材料,有什么办法解决呢?基本你只能改正你所能控制的部分,比如说网址规范化问题,正文内容太少等。用活,用好canonical标签也是一个关键,做好细节,网页一般不太容易被标志成补充材料的。

如何避免出现相似页面

十月 25th, 2011 by cheegt

页面相似度是指网页的内容的相似程度,当两个页面的相似度在80%以上时,很有可能被搜索引擎尤其是Google判断为抄袭页面或复制页面,从而不被收录,甚至降权、删除。

如何避免?

  1. 添加丰富的正文内容
  2. 让搜索引擎的蜘蛛优先抓到正文
  3. 减少网页中不必要的内容结构
  4. 使用更好的元描述来改善页面摘要
  5. 更新正文侧栏或底部的栏目内容

什么是好的元描述策略?

对不同页面给予不同的描述

不要对每一页都采用相同或相似的描述,这样对单个页面出现在网页搜索结果的效果没有帮助。如果这样做,搜索引擎不太可能显示你的描述文字。你应为每个具体的一页写一个准确地描述。在首页或其他总结性页面上对这个网站进行描述,而对其他单个页面使用不同的的描述。如果你没有时间为每一个单页去创造一个描述,显然你应该对你的不同网页考虑优先级和重要程度。至少,为你的关键URL(譬如你的首页和热点页面)创建一个描述。

百度:SEO是寄生虫

三月 22nd, 2010 by cheegt

18号去了趟浙江盘石举办的杭州地区百度推广VIP客户培训会。2点到场,和推广顾问闲扯几句便开始了几百人的会议。这次会议主要讲的是新上线的百度网盟系统。

从分发的百度推广资料上看到这么一段话:

搜索引擎开始体现商业价值的那一刻起,㈠SEO就像寄生虫一样随之产生。㈡SEO对搜索引擎中网站排名的算法进行研究,并利用算法中的某些特征,来提高一个网站的排名。它从一开始就分为黑白两道,白道以搜索引擎算法来调整网站,“配合”搜索引擎对网站进行收录和曝光。黑道,则像黑客一样,寻找算法中的弱点,伪造网站信息来获取排名。㈢SEO优化时钻了网页排序算法的漏洞会影响使用搜索引擎的用户体验,无法与搜索引擎达成双赢,所以百度的态度是坚决反对恶意SEO。

㈣与SEO不同,SEM的作用是帮助客户更好的使用搜索引擎进行营销。

这份资料不知为何人所写,以上内容有4点歧义:

1、SEO是基于搜索引擎的网站优化,并非能以贬义词寄生虫来比喻。

2、SEO是符合搜索引擎算法对网站进行优化,是友好化的。当然黑帽除外。

3、黑帽是黑帽,白帽是白帽。白帽SEO是可以和搜索引擎达成双赢的。混淆而谈是浅薄之人所为。并不理解何为SEO。

4、SEM所做的就是全面而有效的利用搜索引擎来进行网络营销和推广。SEM追求最高的性价比,以最小的投入,获最大的来自搜索引擎的访问量,并产生商业价值。那么SEO就是SEM的一把利器。SEO是基于SEM的。何来与不同之处?难道百度的意思是说SEM就是可笑的竞价排名?

我的域名投资之路

三月 5th, 2010 by cheegt

最近有朋友看到我在卖域名,询问起了我一些域名投资的东西,玩米这块水很深,一两句话不太讲的明白。从09年到现在也有一年多了,一直没写点什么。趁这次把自己的业余经验写出来。

我的域名投资之路

兴趣和摸索

我第一次对域名有兴趣是因为要注册一个域名做博客用,话说这个机会还是一次免费CN注册,参加某论坛的比赛得来的。那个时候有些做站的想法,于是开始研究起来域名,美食类的,健康类的,真的就是自己想,天天泡在易名WHOIS里面查,没什么看得上的,极品点的四字母简写和双拼COM不知道在哪位牛人手里,那时候查的7js8道康姆(去健身吧)印象比较深刻,4杂,朋友说不行,没注册。刚查了下竟然还在。

自己探索了一段时间之后发现原来自己想破脑瓜也想不出几个好点的域名,在了解了每天会有一批域名过期之后,便在网上找过期域名列表,那时候真什么不懂啊,楞是在没有高级筛选的页面查,几百个页面,一页一页的翻,现在想想也挺2的。竟然有那么大的毅力,我想这应该是兴趣使然吧。

学习

做什么行业第一次都是要交学费,好在域名投资这一块我交的学费不多,那时候国际域名还挺便宜的,二十几块一个,朋友做代理的,在他哪里挑了个最便宜的平台,是新网的代理,现在挺后悔的,没有找好平台,转出是个麻烦事,所以这里建议一定要选比较专业的平台。比如:

国际域名平台
易名:www.ename.cn
HUPO:www.hupo.com
Godaddy:www.godaddy.com
拍米:www.paimi.com

CN域名平台
爱名:www.22.cn
国域:www.66.cn

交易平台
金名:www.4.cn
淘名:www.taoming.com
名商:www.dnbiz.cn

域名筛选
金米:www.kingnic.com
查啦:domain.cha.la:8080
歪菜:del.whycai.com
拍米:www.paimi.com/search
易名:order.ename.cn
域名删除时间查询:tool.chinaz.com/DomainDel
(站长工具的中文 WHOIS 也不错,体验挺好)

域名停放
银点:www.silverclicks.com.cn
BODIS:www.bodis.com
DNParking:www.dnparking.com
易名,名商 都有自己的停放平台

域名交流
易名旗下论坛:www.dnbbs.com
域名城:club.domain.cn
HUPO旗下论坛:bbs.yejie.com

这几个平台是我经常去的,易名业务模式比较多,做的比较全,CN代注也还可以,不经常在易名混,没有什么经验,HUPO之前有代注服务 ,一律只要68,先到先得,抢注的米质一般,偶尔会有RP爆发的时候。那时候也是熬到12点猛刷新,提交域名,抢了几个双拼,便宜卖了。现在加了CN域名代注进去,CN代注成功率也不错。至少我要的都到手了。得说一下HUPO的DNS非常不稳定,隔一段时间就会扑街,做站改用其他DNS服务,DNSPOD还行。

GOdaddy 经常会有优惠码,经常会有美女做代言,比较给力。英文好的上吧,不懂也没事,国内教程比较多,学习一下也很快。

CN域名平台是在米农群里知道的,66的界面仿佛回到了九几年,体验非常差,不过代注率和22旗鼓相当,当然这只是我的经验,很多东西要自己体验的。22的客户MM不错,很用心,网站也不错,是第一商务下面的一个项目,听说独立出来了,之前和以前的同学聊天,他在第一商务做BD,知道我玩域名之后还推荐我去22。

交易平台4.CN 在米农圈子里也比较熟悉的,拍卖一般都在易名和4.CN。淘名去年才上线的,HUPO的子站,刚起来。名商网不熟悉,不做评述。

上面分享的几个域名筛选的都是我自己经常用的几个,有些查CVCV类型的域名不错,有些查CN很强劲。

停放我自己在用BODIS,前几天贝宝账户收到几美金,其他没用过,无话语权。

交流论坛,域名城的氛围不错,米友都很YD,个个都MJJ。我不太喜欢逛论坛,群里,论坛都是潜水者。

最后

好吧,几个平台就分享到这里,平台一定要找好一个做为根据地,易名不错。以上都是我自己经常在用的,平时玩米都是自己一个人玩,都是自己琢磨出来的,这一点很不好,玩米一定要多交流。群里多发言,不懂多自己思考和学习。不要P大一点事情问别人,这要切记,人家不鸟你,你立马感觉受打击不玩域名了。

自己主业是玩SEO的,玩米玩了这么久,个中辛苦只能自己体会,多说无益。2011年了,工作上准备辞职了,也不玩米了,留几个域名养着,人就该抓住你擅长的东西不放,别捡了玉米丢了西瓜。

关于域名应该投资哪些类型,这一点我没有太多的经验,因为从一开始我就是从做站的角度来玩域名的,喜欢就收了,不看什么后缀,不看是否值得投资;玩米啊,一定要谨慎,再谨慎,头脑不能发热。

拼音域名双拼COM还是主流,NET比较纠结,上不上下不下。不看好,做站可以,投资不行。

  1. 三拼的COM还处于一个上升空间。
  2. 四数字COM利润不是太高,反正不亏,价格比较饱和了。
  3. CVCV类型的COM域名貌似已经没有了,这类型CN后缀还有不少,CN不解释。我只拿了2个baxa.com.cn 扒虾,eoco.com.cn 品相极好 。
  4. 对于英文COM域名,我想说英语不好不要玩英文域名,你会拼错的,相信我,血淋淋的教训。SweetSuger.com,sugar 不是suger!
  5. 个性创意域名可以参考zou.lu博客。比如:我的Cheng.se 橙色,(Huang.se在一个米友那里)

差不多了,写得挺累的,2个小时了;最后说下买米,快进快出是个不错的方式,资金周转快,最好的时代过去了,玩域名想玩得痛快? 拿钱砸把,有钱? Who cares!