下面是小编整理的Google中文网站站长博客:整合网站重复内容,本文共10篇,欢迎阅读分享,希望对大家有所帮助。本文原稿由网友“不撸女同”提供。
篇1:Google中文网站站长博客:整合网站重复内容
处理网站上的重复内容是一项非常困难的工作,随着网站的发展,必须不断增加、改变或删除各种功能;与此同时,不同的网站内容来了又去。一段时间后,许多网站都会有以多个URL网址形式存在的系统化垃圾代码,这些URL都返回同样的内容。在一般情况下,除了会增加搜索引擎的抓取和索引内容的难度以外,你的网站上存在重复内容并不构成问题。此外,通过导入链接而得到的PageRank以及类似信息可能会在我们尚未确定为重复内容的网页间扩散,导致你的首选网页在谷歌中的排名降低。
处理你的网站内部重复内容的步骤
识别网站上的重复内容。识别你网站上的重复内容是处理重复内容的第一步,也是最重要的一步。使用一种简单的方法可以实现这个目的,即从网页中选取一段独特的文本代码,然后搜索这段文本,并使用谷歌的site:query将搜索结果限制为自己网站上的网页。如此以来,搜索出的含有同样内容的多个结果就是你需要处理的重复内容。
确定你需要的首选URL网址。
在处理重复内容之前,必须确保你的首选URL网址结构。对于这段内容,你希望使用哪一个URL网址?
保持网站内部的统一性。
选择首选网址之后,确保在你的网站内所有可能的位置上使用他们(包括你的Sitemap文件)。
在必要和可能的情况下使用301永久重定向。
可能的话,可以使用301代码将重复网址重新定向为你选择的网址。此举能够帮助用户和搜索引擎在访问重复URL网址时找到你的首选URL网址,
如果你的网站有数个域名,可选择一个域名,使用将其他域名301重定向到这个域名,同时还要确保其转向正确的特定网页,而不仅是域根目录。如果网站同时支持www和非www主机名,可选择其中一种,使用Google网站站长工具中的首选域设置,再进行适当的重定向。
在可能的情况下,在你网页上使用rel=“canonical”。
在无法使用301重定向的情况下,可以使用rel=“canonical”,以方便搜索引擎更好地理解你的网站和首选URL网址。Ask.com、Bing和Yahoo!等主要搜索引擎都支持这种链接标签的使用。
可能的情况下,在Google网站站长工具中使用URL参数处理工具
如果部分或全部网站重复内容来自带有查询参数的URL网址,则此工具将帮助你将URL内的重要参数和不相关参数通知我们。有关此工具的详细信息可参见我们的博客声明。
怎样处理robots.txt文件?
使用robots.txt文件来禁止对重复内容进行抓取不在我们推荐的方法之内。我们建议你不要使用robots.txt文件或其他方式来禁止对你网站上的重复内容的访问。你可以使用rel=“canonical”链接标签、URL参数处理工具或301重定向。如果完全阻止了对重复内容的访问,搜索引擎必须将这些URL作为独立的不同网页处理,因为它们无法分辨出这些URL其实只是指向相同内容的不同网址。更好的解决方法是允许对其进行抓取,同时用我们推荐的方法将这些URL网址明确标记为重复内容。如果你允许我们访问这些URL网址,Google抓取机器人将学会通过查看URL确定其是否为重复内容,在各种情况下都能很好地避免不必要的重复爬行抓取。为了防止重复内容仍然引导我们过多地爬行搜索你的网站,你还可以调整Google网站站长工具里的抓取速度。
篇2:Google(谷歌)的网站优化利器---中文网站管理员工具
在搜索引擎如日中天的今天,网管的工作除了管理网站内容,维护网站性能和安全外,如何通过搜索引擎推销自己的网站成为一个非常重要的任务,谷歌作为世界上最大的搜索引擎,非常注重和网管的互动。8月,谷歌在其网站管理员中心推出了网站管理员工具,并随后推出了中文版。它不但完全免费,和广告完全无关,并且无须安装,是一个在线工具。
不知道这个工具?不要紧,你并不孤单。
5月,我参加了在福建厦门举行的搜索引擎战略大会(SES)。我比较吃惊地意识到,大多数中文网管,包括搜索引擎优化(SEO)业者,并不知道谷歌为他们量体定身所做的这款网站管理员中文工具。换句话说,大多数中文网管以及一些SEO业者还在“摸着石头过河”推销网站或者根本不知道Google已有或者可以提供他们网站的信息。
在谷歌推出网站管理员工具之前,要想推销自己的网站,一个普通网管的做法就是管理好网站的内容,希望谷歌能很好地索引自己的网站,并把自己的网站排在前列。至于谷歌是否真的对所有的页面都进行了正确的索引,自己的网站究竟排在那些关键词查询的前列,哪些网页有反向链接等等问题,绝大多数网管是没底的。可以说网管在搜索引擎面前是比较被动的。有些网站干脆花钱让SEO公司来推销他们的网站。有了谷歌网站管理员工具之后,网管们对自己的网站在谷歌的表现就一目了然了。绝大多数网管可以利用谷歌的网站管理员工具的来轻松地优化他们的网站,对有些网管来说更是如虎添翼。
让我们来看看谷歌的网站管理员工具功能究竟有多强大吧。该工具包含以下主要功能:
你可以在任何连上互联网的计算机上通过网络浏览器(例如Internet Explorer或Firefox)来访问网站管理员工具得到你的网站的信息。
你可以轻松地查询和调整谷歌爬虫爬行你网站的频率。你还可以查询谷歌爬行的成功率并研究为什么不成功。
察看你的网页是否正确地被谷歌索引了。这项功能相当重要。如果谷歌不能正确索引你的网页,其他搜索引擎极有可能也不能正确索引你的网页,
你可以查询哪些网站在链向你的网页。
查询你的网站在哪些Google关键词中排名前列。
查询哪些关键词给你真正带来了流量。
你可以构造你的网站地图,让谷歌索引所有你想要它索引的网页,尤其是那些谷歌还没爬到的网页,以及一些动态网页。
回答各种你所感兴趣的问题。譬如说,什么叫桥页?
有时你可以查询是否你的一些网页违反了谷歌的网站质量指南而受到了惩罚。虽然我们不显示对所有网站的所有惩罚,我们显示了对一些网站的惩罚。
如果你发现作弊网页,你可以通过该工具举报。
在这些功能中,也许第五项功能最为重要。通过它,你可以知道你的网站是否真正排在你所期望的关键词的搜索结果前列。如果不是您所期望的甚至你的网站排在了你不期望的关键词结果前列(例如,你的网站排在了“劣质产品”查询结果的前列),你就必须分析为什么。
该工具的另外一个功能是,如果你使用它,它就是你和谷歌之间联系的桥梁。有时候谷歌想对你的网站进行友情提示,譬如说,你的网站是个好网站,但由于各种原因(例如你的网站被黑了)存在一些违反谷歌网站管理员指南的内容。如果没有网站管理员工具,从你的网页上又根本找不到联系方式,我们就无法联系您。有了工具,谷歌和你的联系就畅通无阻了。
那么怎样才可以使用谷歌网站管理员工具呢?要使用该工具首先要有一个谷歌帐号,即gmail.com帐号。如果你还没有的话,访问www.gmail.com,点击“注册 Gmail”后按照指令操作就可以得到一个帐号。有了帐号后,访问网站管理员中心,点击网站管理员工具就能使用该工具了。你所做的第一件事可能就是添加你所属的网站到该工具。谷歌会通过一个认证的过程来确认你所添加的网站确实属于你。然后你就可以看到谷歌提供给您(也仅仅是给您)的内部信息了。
试试看,希望你能感到“世界真奇妙”。
来自:www.googlechinawebmaster.com//07/google.html
篇3:网站重复内容的几个认识误区
不论是搜索引擎还是网站都是以内容为基础的,独特有价值的内容对排名的意义已经越来越大,但是内容是否独特并不是由我们自己来认定的,从内容创作的角度来讲,我们必需先理解在搜索引擎中重复内容的真正含义,这样能帮助我们更好的理解它对SEO的作用,
对于搜索引擎而言,它们喜欢过滤掉他们认为大量重复的,完全相同的内容。这样能够节约他们抓取和存储的资源,他们也不想在搜索结果中显示多个完全相同的结果,这样对用户来说没有任何意义,从用户的角度来考虑,他如果不喜欢这个内容,他也不希望这个内容出现在搜索结果下方的其它网站上,如果他已经读了第一个搜索结果网站中的内容,那么他也不会再希望下面的网站都是同样的内容。另外重要的一点是:搜索引擎还需要满足不同用户的不同需求,也就是用户的差异化。那么大量重复的内容无疑是搜索引擎不喜欢展现的。
第一,我们讨论内容重复性的时候,主要考虑的是内容,而并不是指一个网站页面上相同的部份,比如:导航,底部,介绍,广告等。当然,这些内容应该尽量简洁,而不要占据大量页面。我们讲内容的独特性更多是指内容不与互联网上其它网站的内容进行重复。
第二,内容的独特性包括内部和外部来源。无论你是复制网站自身之前存在的内容,还是复制其它网站的内容,对于搜索引擎来说,这都是重复的,
如果自身网站有两个重复的内容页面,那最好是使用301将一个页面跳转到另外一个页面。
第三,独特的价值。很多人喜欢去钻石百度的一些内容抓取规则,甚至是迷失在这些规则中,他们的研究结果会认为多少比例的内容会被认为是不重复的,又或是修改首段或尾段能够避免被认为是重复的,以及使用同义词,打乱内容顺序这些方法。这种情况,你通过技术提供了独特的内容,但是你却没有提供独特的价值,独特的价值和独特的内容是非常不同的一件事情。搜索引擎在做,或正要做的事情是通过判断是否对用户有价值来决定收录一个内容是否有意义,而不是停留在判断这个内容是否是独特。我相信,搜索引擎在进行尝试并有能力做到这一点。
第四,想象的比例。行业内在做SEO的时候会经常流行一些说法,比如好的内容应该是不重复比例在50%以上或者70%以上,关键词密度应该不超过2%-8%等。这些神秘的百分比往往会误导很多人。百度算法如果你想得太复杂,那它肯定更复杂,在研究内容重复性这一块,我相信百度判断是否原创的具体比例并不存在。
复制和发布低质量的内容不仅仅是影响这一个文章页面,更是对网站整体质量的一个损害,百度曾发布通告说一个网站的垃圾内容比例超过30%,那么整个网站都将不被信任,如果你的网站不可避免的出现一些重复的内容,那么建议使用技术方法对搜索引擎进行屏蔽。文章首发,请注明SEO博客pengjinjie.com/,尊重版权!
篇4:WP博客无缝整合Google自定义搜索框
今天我给大家分享的是无缝整合Google自定义搜索框的技巧,早在Denis就写过一篇中的教程,可以达到强化搜索、减轻数据库读取和赚取利润的各种好处。其中的第6步是用Google 的搜索框代替主题本身的搜索框,但是现在使用国外主题和付费主题的朋友越来越多了,这类主题都有一共同效果——界面UI棒!拥有精美搜索框的主题也不在少数,如果让你放弃原先精美的搜索框,而用 Google 那简单单一的搜索框是不是会有点不舍呢?
不用担心,接下来 Packy 教你一步步无缝整合Google 自定义搜索框,可以在不修改原搜索框的前提下使用 Google 强大的自定义搜索功能。
如果你是第一次整合Google自定义搜索,可以按照我的步骤来;如果你对代码较了解,可以根据你的需要选择性的看。
第一步:注册并获取 Google 自定义搜索代码
整合 Google 自定义搜索之前肯定必须要先让 Google 为你服务,通过访问www.google.com/cse/ 创建你的搜索引擎。创建完毕后进入“外观”面板,选择“全宽”的布局模式。保存后进入“获取代码”,获得你的 Google 自定义搜索代码:
先保留着这些代码,不用理他,继续第二步
第二步:创建搜索结果页
为了让搜索结果在博客内部显示,我们需要在 WordPress 中创建一个新的页面,用来显示搜索的搜索结果。我们在本地新建一个文件,命名为 search.php,文件内容复制下面的即可:
<?php/*Template Name: search*/?><?php get_header; ?>Loading<?php get_footer(); ?>
其中将“你的 Google 自定义搜索 ID”替换为 Google 给你的“搜索引擎的唯一 ID”,可以在控制面板的基本信息内获取,
保存后将 search.php 上传至你的主题根目录下。
最后在你博客的后台 – 页面中新建页面,在页面属性的模版中找到 search 并选择,写好标题发布即可。
第三步:修改当前主题的搜索提交的表单
这里算是最关键的一步啦,就是当用户点击你博客上任意页面的站内搜索按钮的时候,将用户引导到你刚刚创建的搜索结果页上。这里我们需要在主题文件夹中找到搜索框所在的文件,每个主题都不同,我用我在使用的一款主题来演示吧,找到类似以下的代码:
其中我们需要修改的地方大致如下:
method=”get”action=”/search”还有文本框 name=”q”
*action 的地址可以根据你自己固定链接的方式来修改,只要保证能访问到我们刚新建的页面就行;不管你原先主题搜索框的 name 等于什么,都将引号内的字母改成 q。
第四步:初始化搜索关键字
这是无缝整合 Google 自定义搜索框的最后一步,完成他你就大功告成了哦。这一步我们要做的是:从 URL 中提取浏览者搜索的关键词,然后调用 Google API 进行搜索。听起来很复杂?无需理解,简单的跟着做就可以了:
打开我们刚才新建的 search.php,在 Google 的代码
customSearchControl.draw(‘cse’, options);
后插入以下代码:
var match = location.search.match(/q=([^&]*)(&|$)/);if(match && match[1]){ var search = decodeURIComponent(match[1]); customSearchControl.execute(search);}
大功告成啦,从此以后你依旧可以使用主题原始的搜索框而享受 Google 自定义搜索带来的好处。
篇5:Google如何对待由抄袭造成的重复内容
重复内容一直是网站管理员们热议的话题之一,我们觉得很有必要对在各种会议上和网站管理员支持论坛中我们被问及的常见问题作以下统一解答,
在做深入探讨之前,我想先简要谈谈网站管理员们经常担忧的一个问题:在大多数情况下,网站管理员往往对擅自抄袭和传播自己内容的第三方无能为力。我们知道这并不能归咎于网站管理员们,这也就意味着同一内容出现在许多不同网站其本身并不理所当然地被认为是违反了网站管理员指南。这仅仅导致了Google必须增加一个额外步骤,即鉴别内容的原创来源,而这正是Google所擅长的,在大多数情况下原创内容源都能被正确地识别出来,从而不会给发布真正原创内容的网站带来任何负面影响。
一般而言,我们把网站内容雷同问题主要分为两种情况:
站内内容重复,比如同一内容(经常是无意识地)在您的网站内重复出现。
站间内容重复,比如您网站的内容(同样,经常也是无意识地)在其他网站重复出现。
对于第一种情况,您可以亲自动手解决Google对您网站上的重复内容进行索引的问题。您可以阅读 Adam Lasnik 发表的Deftly dealing with duplicate content以及Vanessa Fox 发表的Duplicate content summit at SMX Advanced。这两篇文章都提供了一些很好的建议,帮助您解决站内内容重复的问题。这里还有一个特别的建议帮助您避免站内内容被重复索引:您可以将您希望被抓取的URL序列包含在您的站点地图文件中。遇到包含同一内容的不同网页时,这么做有助于我们准确收录您真正想提供给用户的那部分内容。其他有关于站内内容重复的信息您可以参阅讨论此主题的有关“帮助中心文章”。
第二种情形可能是有人剽窃了您网站中的内容,并将其展示在其他网站上牟利,
同时,网络代理服务器也经常抓取通过代理方式访问的网站的部分内容。当在不同网站遇到相同内容的时候,我们会基于许多不同的依据来判断究竟哪个网站才是原创,而这样的判断通常是准确的。这也意味着,当您发现有人剽窃了您的内容时,您大可不必过分担心它对您的网站在谷歌搜索排名上的负面影响。
如果您将自己网站的内容与他人分享, 但同时还希望自己的网站被识别为原创来源的话,您需要请合作伙伴在其网站内容上添加指向您原创内容的链接。您也可以在Vanessa Fox最近发表的文章Ranking as the original source for content you syndicate找到其他有关处理这一问题的建议。
有些网站管理员会有这样的疑问: 什么原因会导致有时候抄袭内容反而比原创内容的排名还要高呢?这应该是个特例,但如果您真的遇到这种情况,请您务必做到:
检查一下您的内容是否能被我们抓取。您可能无意间在 robots.txt文件中阻止了部分内容被正常访问。
您可以检查一下Sitemap文件,看看您自己是否改动过那些被抄袭的特定内容。
检查您的网站是否符合网站管理员指南。
最后我想指出的是,在绝大多数情况下,含有雷同重复内容并不会对您的网站在谷歌搜索上的排名有负面影响。这些内容可能已经被过滤出去了。如果您参照上述提到的一些建议,您会了解到怎样才能更精确地控制搜索引擎抓取的内容以及出现在索引中的内容版本。只有被确认为蓄意或恶意抄袭时,雷同重复内容才有可能会被视为违反了网站管理员指南。
来自:www.googlechinawebmaster.com//07/blog-post.html
原文:Duplicate content due to scrapers
发表于:6月9日星期一,上午3:40
篇6:减少网站重复内容的7种方法
在国内很多站点,特别是企业站,查询下收录结果,有很多都是被搜索引擎判为复制内容,复制内容不仅影响搜索引擎的抓取质量还可能影响浏...
在国内很多站点,特别是企业站,查询下收录结果,有很多都是被搜索引擎判为复制内容,复制内容不仅影响搜索引擎的抓取质量还可能影响浏览者的体验度,这里我们针对大多数站点说明下如何减少网站的复制内容,
1、独立的标题
尽量为每个页面写上独立的标题,特别是一些产品页栏目页等,标题是SEO中很重要的一部分,不要轻易浪费掉这块宝地。好的标题不仅对搜索引擎同时对浏览者也是一个好的引导。
2、meta标签(描述、关键词)
不管是否影响排名,写上好的描述对蜘蛛判断复制内容影响很大,同时对浏览者也是一个很好的吸引,是对标题的补充。当然对于关键词就是对描述对内容的一个重点强调。而至于如何实现独立的meta标签,这个要根据你所使用具体的站点程序来定,很多程序(特别是CMS)可能无法实现手工配置每个描述标签,但稍微动下修改下,可以让标题成为描述,当然这是不得已的选择,至少比那种所有网页共用同一个描述、关键词版本强多了!
3、修改文章内容
就算文章不是你原创的,但你最好还是做下修改,比如加上自己的评论看法,或是摘取原文一段作为参考等,
尽量让文章和原文区别开来
4、修改CSS
不少朋友可能有过下载别人整个站或者一些网页的经历,下载来后直接放到自己的空间上,或者稍微做点调整,比如改下标题什么的,但却忽略CSS样式表,这样的网页在很大程度上也很容易被判为复制内容,当然这里我们不是鼓励大家去这样做,只是就这个角度来说明下问题。
5、强调独特的内容
如果有些内容是你独特所有的,那么不妨用“加粗”“下划线”“h标签”等加强一下,告诉搜索引擎这些是特别的,别的地方不常见。
6、减少多重URL
也许你的程序即可实现动态也可实现静态,或者之前是静态现在变为动态等情况,出现一个网页有多个URL,
这两种都是指同一个网页,但却被搜索引擎以不同的URL抓取,这种情况我们尽量使用一种URL格式。
7、减少无效链接
由于某些原因,我们重新设计了网站结构和URL格式,但却忽略了原来一些旧内容的清除工作,结果导致搜索引擎对同样的内容以不同的URL抓取,这和第6点比较相似,但这是指的那些我们不想要却实际存在在空间上的网页,特别是对一些内容较多的信息站点,建议用xenu或者google网站管理员去掉这些无效的链接。
篇7:网站的重复内容对SEO有影响吗?
处理网站上的重复内容是一项非常困难的工作,随着网站的发展,必须不断增加、改变或删除各种功能;与此同时,不同的网站内容来了又去。...
处理网站上的重复内容是一项非常困难的工作。随着网站的发展,必须不断增加、改变或删除各种功能;与此同时,不同的网站内容来了又去。一段时间后,许多网站都会有以多个URL网址形式存在的系统化垃圾代码,这些URL都返回同样的内容。在一般情况下,除了会增加搜索引擎的抓取和索引内容的难度以外,网络推广你的网站上存在重复内容并不构成问题。此外,通过导入链接而得到的PageRank以及类似信息可能会在我们尚未确定为重复内容的网页间扩散,导致你的首选网页在谷歌中的排名降低。
大部分的网站管理员都已经知道重复内容能给网站的排名带来负面效应。但是怎样才能检查某个特定的网站是否存在这个问题,并且怎样才能减少或者避免它呢
从一开始,可以将重复内容划分为两个主要的种类:
网站结构导致的重复内容
内容盗窃导致的重复内容
关于网站结构导致的重复内容
一些网站结构本身会引起重复内容,实例如下所示:
打印友好(ptint-friendly)的页面
在多个页面上具有大体相似的内容,而能通过不同的URL地址访问
页面上有非常类似的单元,比如在一个电子商务种类中,网络推广一连串不同颜色的衬具有相似的描述
页面是一个追踪应用程序的会员程序的一部分,且这个程序配置不正确
多个页面有重复的标题或重复的meta标签值
在URL地址中使用会话
标准化问题
为了查找网站结构导致的重复内容,可以使用site.www.kxfdj.com查询串来检查已被搜索引擎索引过的网站的URL地址。所有主要的搜索引擎(Google,Yahoo!,Microsoft Live Search)都支持这个功能,
网站推广通常,“打印友好”的页面如果被索引的话,就会很快显示出来。
经常将它认为是重复内容的内容放在“补充索引(supplemental index)”中。在搜索引擎结果的最底下有个补充材料的标记,放置的就是这些内容。当然,现在Google已经将这个标识隐藏起来了。如果某个Web站点有很多页面出现在补充索引中,可能意味着这些页面是重复内容――至少Google这么认为。如果可能的话,研究这几个页面的URL地址,并查找有没有前述的情形。特别要看看位于结果后面的页面。如果不注意就特别容易产生重复内容问题,因此以有利于搜索引擎的观点去看将很有用处。
关于内容盗窃导致的重复内容
内容盗窃产生的是一个完全不同的问题。正如盗贼能偷真实的财产一样,他们也能窃取内容。毫无疑义,这是为什么它被称为内容盗窃的原因。而这为搜索引擎带来了问题,因为搜索引擎努力从搜索结果之中(也从不同的网站之中)过滤重复内容,难免有时会对哪些是原创权威内容做出一些错误认定。
在某些情况下,这是个隐蔽的问题,并且可能给排名带来灾难性的影响。网站推广如果你是内容盗窃的牺牲品,并且想要有所行动,那么首先要给那个使用非法内容的人发送一封要求暂停并中止的信。可以使用该网站提供的联系信息,或者该域名在WHOIS记录中的联系信息。如果这个方式失败,那么可以找主流搜索引擎来警告他们的内容盗窃行为。
基本上只要一个网站是坚持不断的更新原创内容,百度、Google、雅虎等搜索引擎已经能够很好的识别原创内容的原始出处。网站管理员需要做的就是,每天坚持更新高质量的网站内容。
一段时间后,许多网站都会有以多个URL网址形式存在的系统化垃圾代码,这些URL都返回同样的内容。在一般情况下,除了会增加搜索引擎的抓取和索引内容的难度以外,你的网站上存在重复内容并不构成问题。此外,通过导入链接而得到的PageRank以及类似信息可能会在我们尚未确定为重复内容的网页间扩散,导致你的首选网页在谷歌中的排名降低。
处理你的网站内部重复内容的步骤
识别网站上的重复内容。
识别你网站上的重复内容是处理重复内容的第一步网站推广,也是最重要的一步。使用一种简单的方法可以实现这个目的,即从网页中选取一段独特的文本代码,然后搜索这段文本,并使用谷歌的site:query将搜索结果限制为自己网站上的网页。如此以来,搜索出的含有同样内容的多个结果就是你需要处理的重复内容。
篇8:关于网站内容重复的10个建议
最近,搜索引擎战略会议在严寒的芝加哥举行,许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有...
最近,搜索引擎战略会议在严寒的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。
什么是内容重复?
重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的url上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。
什么不是重复内容?
虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。
为什么谷歌关心重复内容?
谷歌用户使用google时通常希望看到多样化的原创内容。假如他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站治理员不愿意看到google给出象example.com/contentredir?value=shorty-george?=en一样复杂的url。他们往往更喜欢类似example.com/en/shorty-george.htm的url。
谷歌做了些什么?
google在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,假如你的网站有文章的正常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上… 因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。
网站治理员如何主动处理内容复制问题?
适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的”最佳”版本,你也许希望指引谷歌选取你的首选版本。譬如说,假如你不想我们索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取,
使用301重定向:假如你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(永久性重定向)来重定向你的用户、google爬虫、以及其他搜索引擎蜘蛛等。
链接要一致:努力使你的内部链接保持一致; 不要既有/page/,又有/page和/page/ 的内部链接.
使用顶级域名:为了让我们总是使用最合适的文件版本, 请尽可能使用国家特定的顶级域名。与诸如example.com/de或de.example.com的url相比,谷歌肯定更清楚地知道example.de是以德文为核心的内容。
小心辛迪加式的联合供文:假如你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注重:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
使用谷歌网站治理员工具的首选域功能: 假如其他网站链接你的url时既使用www版本又使用无www的版本,你可以用谷歌网站治理员工具让我们知道你想要哪种索引方式。
减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权具体声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。
避免发布无内容页:用户不喜欢看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及google爬虫)才不会看到无穷多的写着“以下是在【某城市名】中不可错失的待租房列表…”但其实根本没有什么列表的网页。
了解你的内容治理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。
不要担心,保持快乐:不要过分受搜刮(挪用和)你内容站点的干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。假如你实在忍无可忍, 欢迎你提出千禧年著作权法案申请 来声明对你的内容的所有权。我们会处理那些无赖网站。
总之, 假如你对内容复制问题有一个大体的熟悉,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。
篇9:从博客的角度看网站内容的
很多站长可能都有自己的个人博客,如果是独立域名,可能会发现,自己的网站PR值升的特别快,并且ALEXA排名也上升的很快.小沈阳兰花指一点:这...
很多站长可能都有自己的个人博客,如果是独立域名,可能会发现,自己的网站PR值升的特别快,并且ALEXA排名也上升的很快.小沈阳兰花指一点:这是为什么呢?
我想可能是基于两个方面.一,内容,二,友情链接.
一,首先说内容,自己写博客,内容的原创性毋庸置疑.都是自己的东西,有人就不服气了,我的博客就不是自己的东西,他的排名不也高高的?这你可就错了,就是你转载的东西,大多人也会有种占有欲,添那么一两个字,弄成是自己的东西.并且博客的更新速率快,所以蜘蛛大哥也就忙的很.
二,友情链接.博客的外链分为两种,一是友情链接,二是转载得到的链接.友情链接大多也都是博客,所以蜘蛛大哥就跑的勤.这也就是增加蜘蛛访问率的好方法.而,转载得到的链接,就能够很大程度上增加自己的PR值.这对站长来说很重要.例如自己有了个新站,PR一直上不去,用自己的博客链接一下,上升的速度可能要快些.
今年年中,流传一个帖子,说是国内几个着名的PR7的博客,我想他们的秘诀可能就在这里.
接下来说到网站内容的原创,很多站长最头疼的可能就是这个,这比JJ起不来还可怕.我想说,没关系!不是每个人都是技术出身,你要想做原创内容,必须要低下头,静下心来.原创也就不那么可怕.我举个例子来说啊,别人是做手机技术的网站,OK,别人有技术,我没有,我勤奋一点,天道酬勤嘛.咕~~(snt)b.我把别人的技术贴子整理一下,这反过来可能就是当初hao123的思路,我没有技术,那么我可能整理别人的技术性的东西.整理以后,这就是属于自己的东西了,因为是自己辛苦整理的.还有什么设计站了,行业站了,等等,不要总想着流量,而把所有有用的东西都分开来,那样是技术站的做法,而没技术的只能从整合下手了.
你还想听嘛?且听下回分解.
厚诚集智 成长无限 企业大学网 www.51hlhu.com
篇10:站长增加网站内容绝对不能用采集
现在很多站长为了给自己的网站填充内容,都用采集工具给网站增加内容,这样做可以大大减少人力,但是长期这样的做的后果是给你的网站增加了...
现在很多站长为了给自己的网站填充内容,都用采集工具给网站增加内容,这样做可以大大减少人力,但是长期这样的做的后果是给你的网站增加了一个不可抹去的失败理由.
给大家说说一下几种采集的都是会被搜索识别出来的,所以请大家不要耍小聪明,因为搜索比你聪明多了:
首先我要给哪些现在还在以采集而增加网站内容的朋友提个醒了,虽然现在你的网站收录在不断的增长,而且速度很快,但哪天搜索认为是该处理问题的时候你的网站收录量会被搜索大大删减,而且权重也会大大的减低.现在没有出现这样的情况只是搜索还在考察你,等考察清楚后对于这样长期采集的网站就会得到前面所说的哪些惩罚.
第一种采集方法、最近看到说是采集时只用采集的文章的一部分内容,这样搜索因为没见过这文章,以原创方式来收录的你网站页面,这样收录的很是厉害.这种情况我可以明确的告诉你的是失败的做法,一段时间后搜索会慢慢的拒绝收录的你网站内的内容,为什么这样呢?一直采集的都是原文的部分内容,这样到了你网站里的内容却是没头没尾的内容了,这样搜索认为你网站的权威性不够.
第二种采集方法、据了解现在的火车头等知名采集软件都具备同义词替换功能,例如“SEO”自动替换为“优化”这样的替换,虽然一开始只要你的替换词组多,那么一篇文章,可以说就有很多的词语会被替换掉.但是经过那么多的搜索的更新,搜索现在可以完完全全的识别出来,所以利用这样功能来采集内容的结果是一样的.
第三种采集方法、这样情况更是常见了,就是把多个网站的内容都采集到自己的网站上.其实这样情况是最好理解的,不管你到处采集东西,还是在一个地方认真的采集东西,情况都是一样的,那就是采集,搜索对于采用这样方法的网站都是施行抛弃的动作.
其实这么三种方法都不可行,不是说不能用采集,只是要告诉大家增加网站的内容绝对是不能用采集的,如果你的网站内容有超过百分之五十都是采集过来的内容,那么你的网站危险了,请大家按照现网络上流程的更新原创、伪原创、转载的比例1:2:2来适当的增加网站内容
厚诚集智 成长无限 www.51hlht.com
- 技术类网站内容的建设技巧2022-12-11
- 网络推广、网站信息管理/内容编辑简历2023-07-08
- 网站管理者的简历应该展示出哪些内容?2022-04-16
- 站长们:别只专注优化,忘记了网站的安全WEB安全2023-06-09
- 用主题归类(Siloing)提高网站内容相关性2023-08-13