Googleは、昨年からペンギンアップデートやパンダアップデートのようにコンテンツの重複や価値のないコンテンツを検索結果の上位から排除することにちからを注いでいます。
しかし未だにスクレイピングなどによる類似コンテンツが、オリジナルのコンテンツのページより上位に表示されている状態が見られます。
High Rankings.comのフォーラムにコンテンツの盗用に関してのスレッドがありました。
Content Theft And My Top Tipこの記事では、コンテンツの盗用に関して、rel=author を使って、著者情報をオリジナルコンテンツに盛り込むべきという回答が寄せられています。
rel=author は、2011年6月くらいに発表されたタグで、最近は、けっこう使われているようで、検索結果にもURLのしたの行に「著者」として表示されるようになりました。
さらにGoogleでは、確認の取れた著作情報があるコンテンツは、ないコンテンツより上位に表示すると発表しています。
最近では、Googleは、rel=publisher というタグも推奨しているようです。
どちらのタグもリンクの要素として使う形でGoogle+の個人情報かGoogle+のページにリンクを張る形をとるようです。
High Rankings.comのフォーラムにも書いてありますが、WEB上の情報は、すべて盗まれる可能性があるということを認識して、オリジナルの情報が上位に来るように自分でもできることはしておくに越したことはないということでしょう。
フォーラムでは、もうひとつ流用されたコンテンツから自分のサイトにリンクを張るようにすれば、リンクが集まりっ自分のサイトが上位化するのでは、という話も出ていましたが、スパムサイトからのリンクが集まる可能性があり、逆にオリジナルのサイトの順位がおちるのでないかとの心配の意見も出ていました。
私は、このような流用コンテンツを使っているサイトからリンクを構築するのは、正直、やめたほういいのではと思います。
スパムサイトと認識されているところからのリンクが増える可能性があるので、リスクが高すぎるように感じます。
流用サイトを見つけて、Googleに報告するのもひとつの手だと思いますので、自分のサイトを守るためにいろいろやってみるのがいいと思います。
下記のツールも活用してみてください。
ミラーサイト判定ツール sujiko.jp