중복 콘텐츠
중복 콘텐츠 란 무엇입니까?
중복 콘텐츠는 인터넷에 여러 곳에서 나타나는 콘텐츠입니다. 이 "한 곳"은 고유 한 웹 사이트 주소 ( URL )가 있는 위치로 정의됩니다. 따라서 두 개 이상의 웹 주소에 같은 내용이 나타나면 중복 된 내용이있는 것입니다.
이문제는 네이버seo 에도 해당합니다.
기술적으로 벌칙은 아니지만 중복 콘텐츠가 검색 엔진 순위에 영향을 미칠 수도 있습니다. 구글 이 인터넷에서 한 곳 이상의 장소에서 "상당히 유사한"내용을 여러 개 가지고있을 때 , 검색 엔진이 특정 검색어에 더 적합한 버전을 결정하는 것은 어려울 수 있습니다.
중복되는 내용이 중요한 이유는 무엇입니까?
검색 엔진의 경우
중복 된 콘텐츠는 검색 엔진에서 다음과 같은 세 가지 주요 문제를 나타낼 수 있습니다.
그들은 색인에서 포함 / 제외시킬 버전을 알지 못합니다.
그들은 링크 메트릭 (trust, authority, anchor text ,링크 에퀴티 등)을 한 페이지에 표시하거나 여러 버전으로 구분할 수 있습니다.
그들은 쿼리 결과에 대해 어떤 버전을 순위를 매기는지 알지 못합니다.
사이트 소유자 용
중복 콘텐츠가있는 경우 사이트 소유자는 순위 및 트래픽 손실을 겪을 수 있습니다. 이러한 손실은 종종 두 가지 주요 문제에서 비롯됩니다.
최고의 검색 경험을 제공하기 위해 검색 엔진은 동일한 콘텐츠의 여러 버전을 거의 표시하지 않으므로 어떤 결과가 가장 적합한 버전인지 선택해야합니다. 이렇게하면 각 복제본 의 가시성이 희석 됩니다.
다른 사이트에서도 복제본 중 하나를 선택해야하기 때문에 링크 자본을 더 희석 할 수 있습니다. 하나의 콘텐츠를 가리키는 모든 인바운드 링크 대신 여러 개의 링크로 연결되어 복제본간에 링크 에퀴티를 확산시킵니다. 인바운드 링크는 순위 요소 이기 때문에 콘텐츠의 검색 가시성에 영향을 줄 수 있습니다.
그물 결과? 콘텐츠가 있으면 검색 가시성이 향상되지 않습니다.
검색 엔진에 대한 중복 콘텐츠 문제
중복 된 콘텐츠 문제는 어떻게 발생합니까?
대다수의 경우 웹 사이트 소유자는 의도적으로 중복 된 콘텐츠를 만들지 않습니다 . 그러나 그것이 그곳에 있지 않다는 것을 의미하지는 않습니다. 실제로 일부 견적 에 따르면 웹의 최대 29 % 는 실제로 중복 된 콘텐츠입니다!
중복 콘텐츠가 실수로 생성되는 가장 일반적인 방법을 살펴 보겠습니다.
- 유사 URL
클릭 추적 및 일부 분석 코드와 같은 URL 매개 변수는 중복 된 콘텐츠 문제를 일으킬 수 있습니다. 이것은 매개 변수 자체에 의해서뿐만 아니라 매개 변수가 URL 자체에 나타나는 순서로 인해 발생하는 문제 일 수 있습니다.
예 :
www.widgets.com/blue-widgets?color=blue는 www.widgets.com/blue-widgets의 사본입니다.
www.widgets.com/blue-widgets?color=blue&cat=3은 www.widgets.com/blue-widgets?cat=3&color=blue의 사본입니다.
마찬가지로 세션 ID는 일반적인 중복 콘텐츠 작성자입니다. 이것은 웹 사이트를 방문하는 각 사용자에게 URL에 저장된 다른 세션 ID가 할당 될 때 발생합니다.
세션 ID 또는 매개 변수로 인해 중복 된 콘텐츠가 생성 될 수 있음
프린터 친화적 인 버전의 콘텐츠는 여러 페이지 버전의 색인이 생성 될 때 중복되는 콘텐츠 문제를 일으킬 수 있습니다.
프린터 친화적 인 페이지 버전으로 인해 중복되는 콘텐츠 문제가 발생할 수 있습니다.
여기서 한 가지 교훈은 가능한 경우 URL 매개 변수 또는 다른 URL 버전 (일반적으로 스크립트에 전달 될 수있는 정보)을 추가하는 것을 피하는 것이 좋습니다.
비 -WW 페이지 대 HTTP 대 HTTPS 또는 WWW
귀하의 사이트가 "www.site.com"과 "site.com"에서 별도의 버전을 가지고 있고 ( "www"접두사가 있거나없는) 두 버전 모두에서 동일한 컨텐츠가 존재한다면 효과적으로 각각의 사본을 생성 할 수 있습니다 페이지. http : // 및 https : //에서 버전을 유지 관리하는 사이트에도 동일하게 적용됩니다. 페이지의 두 버전이 모두 게시되어 검색 엔진에 표시되는 경우 중복 된 콘텐츠 문제가 발생할 수 있습니다.긁거나 복사 한 콘텐츠
콘텐츠에는 블로그 게시물이나 광고 문안뿐만 아니라 제품 정보 페이지가 포함됩니다. 자신의 사이트에서 블로그 콘텐츠를 재 게시하는 것은 중복 콘텐츠의 더 친숙한 소스 일 수 있지만 전자 상거래 사이트뿐만 아니라 제품 정보에도 공통된 문제가 있습니다. 많은 웹 사이트에서 동일한 항목을 판매하고 모두 해당 항목에 대한 제조업체의 설명을 사용하면 동일한 콘텐츠가 웹의 여러 위치에 표시됩니다.
중복 콘텐츠 문제를 해결하는 방법
중복 컨텐츠 문제를 해결하는 것은 모두 동일한 핵심 아이디어로 이어집니다 : 중복 중 어느 것이 "올바른"것인지 지정하십시오.
사이트의 콘텐츠를 여러 URL에서 찾을 수있을 때마다 검색 엔진에 대해 표준화 되어야합니다 . 이렇게하는 세 가지 주요 방법을 살펴 보겠습니다. 301 리디렉션을 올바른 URL로 사용하거나 rel = canonical 속성을 사용하거나 Google Search Console에서 매개 변수 처리 도구를 사용하십시오.
301 리디렉션
대부분의 경우 중복 된 콘텐츠를 차단하는 가장 좋은 방법 은 "복제"페이지에서 원래 콘텐츠 페이지 로 301 리디렉션 을 설정하는 것 입니다.
잠재적 인 우위를 지닌 여러 페이지가 단일 페이지로 결합되면 서로 경쟁하지 않을뿐만 아니라, 또한 전반적으로 관련성과 인기도가 높아집니다. 이렇게하면 "올바른"페이지의 순위를 결정하는 데 긍정적 인 영향을 미칩니다.
301 리디렉션으로 중복되는 콘텐츠 문제 해결
Rel = "표준"
중복 된 컨텐츠를 다루는 또 다른 옵션은 rel = canonical 속성 을 사용하는 것 입니다. 이렇게하면 지정된 페이지가 지정된 URL의 사본 인 것처럼 취급되어야하며 검색 엔진이이 페이지에 적용하는 모든 링크, 콘텐츠 메트릭 및 "순위 결정력"은 지정된 페이지에 실제로 적립되어야한다고 검색 엔진에 알립니다. URL.
rel = canonical로 중복 콘텐츠 주소 지정
rel = "canonical"속성은 웹 페이지의 HTML 헤드의 일부이며 다음과 같습니다.
일반 형식 :
... [문서의 HTML 헤드에있을 수있는 다른 코드] ...
<link href = "ORIGINAL PAGE"rel = "canonical"/>
... [문서의 HTML 헤드에있을 수있는 다른 코드] ...
rel = 표준 속성은 원래의 (정식) 페이지에 대한 링크로 대체 된 위의 "원래 페이지의 URL"부분과 함께 페이지의 각 복제 버전의 HTML 헤드에 추가되어야합니다. 따옴표는 계속 사용하십시오.이 속성은 301 리디렉션과 거의 동일한 링크 자본 (순위 지정 권)을 전달하며 페이지 대신 (서버 대신) 수준에서 구현되므로 종종 개발 시간이 단축됩니다. 도구.
다음은 표준 속성이 어떻게 작동하는지 보여주는 예입니다.
duplicate-mozbar-screenshot_170315_161150.png? mtime = 20170315161151 # asset : 4195 : url
MozBar 를 사용하여 표준 속성을 식별합니다.
여기에서는 BuzzFeed가 rel = canonical 속성을 사용하여 URL 매개 변수 (이 경우 클릭 추적) 사용을 수용하는 것을 볼 수 있습니다. 이 페이지는 두 개의 URL로 액세스 할 수 있지만 rel = canonical 속성은 모든 링크 연결 및 콘텐츠 측정 항목이 원본 페이지 (/ no-one-does-this-more)에 부여되도록합니다.
메타 로봇 Noindex
중복 된 콘텐츠를 다루는데 특히 유용 할 수있는 하나의 메타 태그는 "noindex, follow"값과 함께 사용되는 메타 로봇 입니다. 일반적으로 Meta Noindex 라고하며 , 기술적으로 content = "noindex, follow"로 알려진이 메타 로봇 태그는 검색 엔진 색인에서 제외되어야하는 각 개별 페이지의 HTML 헤드에 추가 될 수 있습니다.
일반 형식 :
... [문서의 HTML 헤드에있을 수있는 다른 코드] ...
<meta name = "robots"content = "noindex, follow">
... [문서의 HTML 헤드에있을 수있는 다른 코드] ...
메타 로봇 태그는 검색 엔진이 페이지의 링크를 크롤링 할 수는 있지만 해당 링크를 색인에 포함하지 못하게합니다. 중복 페이지는 Google에 색인 생성하지 말라고해도 크롤링 할 수 있어야합니다. Google은 웹 사이트의 중복 콘텐츠에 대한 크롤링 액세스를 명시 적으로주의하기 때문에주의해야합니다. (검색 엔진은 코드에서 오류가 발생했을 때를 대비하여 모든 것을 볼 수 있기를 원합니다. 모호한 상황에서는 [자동으로] "판단 호출"을 할 수 있습니다.)
메타 로봇을 사용하는 것은 페이지 매김 과 관련된 중복 컨텐츠 문제에 특히 좋은 솔루션입니다 .
Google Search Console에서 선호 도메인 및 매개 변수 처리
Google Search Console을 사용하면 사이트 의 기본 도메인 (예 : http://www.yoursite.com 대신 http://yoursite.com)을 설정하고 Googlebot이 다양한 URL 매개 변수를 다르게 크롤링 해야하는지 (매개 변수 처리) 여부를 지정할 수 있습니다.
중복 콘텐츠 -google-search-console-settings.png? mtime = 20170315155632 # asset : 4191 : url
URL 구조 및 중복 된 콘텐츠 문제의 원인에 따라 선호 도메인이나 매개 변수 처리 중 하나 (또는 둘 다!)를 설정하면 해결책이 될 수 있습니다.
중복 콘텐츠를 처리하기위한 기본 방법으로 매개 변수 처리를 사용하는 데있어서 가장 큰 단점은 변경 사항이 Google에만 적용된다는 것입니다. Google Search Console을 사용하여 규칙을 적용해도 Bing이나 다른 검색 엔진의 크롤러가 사이트를 해석하는 방법에는 영향을 미치지 않습니다. Search Console에서 설정을 조정하는 것 외에도 다른 검색 엔진 용 웹 마스터 도구를 사용해야합니다.
중복 된 내용 처리를위한 추가 방법
웹 사이트에서 내부적으로 링크 할 때 일관성을 유지하십시오. 예를 들어, 웹 마스터가 도메인의 표준 버전이 www.example.com/이라고 판단하면 모든 내부 링크는 http : // www 로 이동해야합니다 . http : // example.com/page가 아닌 example.com/example (www가 없다는 사실을 확인하십시오).
콘텐츠를 신디케이션 할 때 신디케이션 웹 사이트가 URL의 변형이 아닌 원본 콘텐츠에 대한 링크를 다시 추가하는지 확인하십시오. 자세한 내용 은 중복 된 내용 을 다루는 Whiteboard Friday 에피소드를 확인 하십시오.
콘텐츠에 대한 SEO 크레딧을 훔치는 콘텐츠 스크래퍼에 대한 추가 보호 수단을 추가하려면 기존 페이지에 자체 참조 rel = 표준 링크를 추가하는 것이 좋습니다. 이 URL은 이미있는 URL을 가리키는 표준 속성으로 일부 스크래퍼의 노력을 방해합니다.
자체 참조 표준 링크는 스크래퍼로 인한 중복을 방지 할 수 있습니다.
자체 참조 rel = 표준 링크 : rel = canonical 태그에 지정된 URL은 현재 페이지 URL과 동일합니다.
모든 스크래퍼가 소스 자료의 전체 HTML 코드를 포팅하는 것은 아니지만 일부는 그렇게 할 것입니다. 그렇게하는 경우 자체 참조 rel = canonical 태그는 사이트의 버전이 "원본"콘텐츠로 신용을 얻도록합니다.
novela-soft.com