ウェブサイトを見て、全体の25~30%のコンテンツが他のサイトのコンテンツと同様であれば
コピーコンテンツとみなされます。
コピーコンテンツというものは、通常ウェブ制作していれば起こりえるものです。
ブログの一部を引用したり、ブログのリンクを貼ったりということは、よくあることです。
そのため、コピーする度にスパムとみなされるというものではありません。コンテンツを引用することで、
元のコンテンツを補足したりするので、それ自体はユーザーに有益な情報を提供していることになり、
悪いことではありません。
現状として、グーグルはまずコピーコンテンツを探し出し、コピーコンテンツをグループ分けします。
検索したときに、まったく同様の2つのコンテンツが検索結果に表示されたとします。
通常は、同じ2つのコンテンツを表示せず、1つのコンテンツ(ページ)を表示して
もう一つのコンテンツを検索結果から外すことはあります。
ただ、それはまったく同じ情報が検索結果にたくさん並んでしまうのを防ぐためであり、
スパムとしてペナルティを与えたわけではなく、コピーコンテンツであっても、
正しく検索順位表示されるようにグーグルは評価しています。
これは、コピーコンテンツを悪用したり、乱用したり、悪意があってズルしようとしたりするなら、
グーグルが正しく評価した上で「スパムとして扱う」ということを意味します。
ツイッターで「コンテンツが自動作成されたブログが、悪意のあるスパムではないとするには
どうすればいいですか?」という質問がありましたが、価値のないコンテンツを自動作成している
だけならばそれは問題なので、スパムとしてみなされる可能性は高いでしょう。
ただ、通常の通りウェブサイトを作っている分には特に問題ありません。
xxx.com、xxxx.ukのようなドメインが違うだけでコンテンツが同じだったり、
新しいサイトを作ったけれど、しばらく古いバージョンと新しいバージョンのサイトを保有していたとしても、
それはよくあることなので気にすることはないでしょう。
コピーコンテンツであっても、悪意のある価値のないコピーコンテンツでない限り、
グーグルがスパムとして扱うことはないようです。
参考サイト:
How does Google handle duplicate content?