カレンダー

« 2009年9月123456789101112131415161718192021222324252627282930
あの 「サクサク動くセキュリティソフト」の最新版が出た。(PR)

Googleインデックスから削除された理由はCSSによる画像置換!?

| | コメント(3)
d081202a.jpgある日、Googleインデックスから私の運営サイトの1つが丸ごと消えていることに気づきました。

そのドメインには数千におよぶページがありましたが、すべて消えているのです。

「site:(ドメインのURL)」

と何度検索しても見つかりません。

思い出したようにGoogleのウェブマスターツールを見てみると、こんなメッセージが。

貴サイトにおきまして、ウェブマスターガイドラインに沿わない箇所が確認されました。
「隠しテキストや隠しリンクを使用しない。」の項目への不適合~引き続きGoogle のインデックスへの登録をご希望の場合は、修正して再審査をリクエストしてください。


そんな!?
SEOのための裏工作なんかしてないぞ!
頭が真っ白になりました。

事件現場は混沌としていた

Googleからインデックス除外を受けたドメインは、Yahooのビジネスエクスプレス(有料ディレクトリ)にも登録している商用サイトでした。

さらに、該当ドメインのサブディレクトリにはアフィリエイトで様々なサービスを紹介するサイトもいくつかありました。

別々の時期に、別々の方法で作った、様々なジャンルのサイト。
それがこの1つのドメインで共存していたのです。

冷静さを欠いた初動捜査

「インデックス除外」という事実に頭がパニックになっていた私は、最初冷静に対処できませんでした

あまりにたくさんのページ、たくさんのサイトがあったため、どこから調べたらいいか分からなかったのです。

ウェブマスターツールに入っていたメッセージには「隠しテキストや隠しリンクを使用しない」の項目への不適合が確認された、と記載があったのですが、その一例として挙げられているポイントが不可解でした。

ちなみに、メッセージには具体的にどのソースが悪いとは書かれておらず、ホームページで使われている文章だけが書かれていました。

1つは、ホームページ上部のタイトル部の文章でした。
ここが指摘されているということは、CSSでの画像置換が悪いということになります。
よく「CSSでタイトルを画像置換したらSEOスパムになるか?」という議論がありますが、実際にはこれはスパムとされていないようですし、実際にこうしたデザイン上の修正を行っているサイトはいくらでもあります。

もう1つ指摘されていたポイントは、全く理解不能でした。
隠しリンクでも隠しテキストでもなく、目に見える大きな文章として表示されていました
その時は、「実は目に見えるテキストのほかに目に見えないテキストが存在していたこと」に気づかなかったのです。

そして様々な疑念も冷静な対処の妨げとなりました。
サブディレクトリにはアフィリエイトリンクを含んだサイトもありますが、アフィリエイトに対する社会的な厳しい見方が高まっていること、Googleもユーザーの利益を確保するためにそういったものに厳しく対処せざるをえないこと。
サイト内にはAmazon Web Serviceを利用した動的なページ(機械的に作成されたページ?)も存在すること。
ランキング(コミュニティとして見られることもありますが、過剰なSEO対策と見られることもある)にも参加していること。
アクセス解析サービスから提供されたタグにnoscriptを利用したSEOスパム(これはサービス提供側が仕込んでいるものですが)があったこと。

疑いだしたらキリがない。
複数のサイトを1つのドメインで作成したことも後悔しそうでした。

CSSでの画像置換での失敗

1つめのポイントはソースをよく見たら理解できました。
冷静に見ればすぐに分かったかもしれませんが、なにしろ混乱していたんです。
Googleから隠しリンク・隠しテキストとして指摘された部分のソースはこんな感じです。

[HTML]

<div id="header">
<h1 id="blog-name"><a href="サイトURL" accesskey="1">サイトのタイトルです</a></h1>
<p class="blog-description">ここにサイトの概要が入ります</p>
</div>

[CSS]

/* ヘッダ */
#header {
border-bottom: 1px solid #bed5b4;
height: 80px;
background: url(images/画像.gif) no-repeat;
text-indent: -9999px;
outline-width: 0;
}

HTMLは普通です。
MovableTypeでブログを作成すると、最初こんな感じになっていると思います。

CSSでheaderを画像置換しているんですが、ここが問題で・・・。
実はここで置換しているのは画像.gifは単なるイラストでした、タイトルも概要も書かれていません。
ヘッダー部に様々なパーツがあってCSS初心者にはレイアウトが難しい状態だったことが原因で、タイトルロゴはheaderの直前に別途表示していました。
だからブラウザで見る限りでは隠してはいないのですが、この部分だけを取り上げると「隠しリンク・隠しテキスト」になってしまいます。

CSSでサイトを作成したのが初めてだったので、「見た目」も「ソース」もつじつまの合う正しいものとして仕上げられなかったのです。

この部分を作成したのは1年以上前。
当時の状況をすっかり忘れていました。

2つ目のポイントは利用したテンプレートにあった

2つ目のポイントは明らかなSEO対策のようにも思えますが、MovableType用に販売されていたテンプレートを利用しただけだったため、ソースの細かい部分まで気にしていませんでした。

こちらのHTMLはこんな感じです。

<a href="URL" title="カテゴリ概要">カテゴリ名</a><span class="category-desc">カテゴリ概要</span>

一見、全然問題ないように見えますが、<a>タグのtitle属性と<span class>タグに「カテゴリ概要」が二重に記述されてしまうため、隠しテキストと判断されてしまうようです。

この2つのタグが本来どんな目的で使われるのか?
どういう使い方だとスパム扱いされるのか?

詳細が知りたいところですね。

修正、経過報告、インデックス復活

まず上記の2点を修正しました。
1.CSSをやめて普通のテキストに戻しました。ヘッダー部はただのテキストだけになってしまいましたが、レイアウトは今後の課題ということで。
2.title属性・spanタグを削除しました。

そしてそれまでの経過を記載した再審査申請メッセージをウェブマスターツールで送った数日後=サイトがインデックス除外されてから9日後、インデックスが無事復活しました。

同じテンプレートを使っている人で原因が分からずに別のドメインでサイトを作り直した話。
いくら再申請してもインデックスが復活しなかった話。
再審査には数週間かかると記載されていたこと。など。

色々聞いていたので、私も長期戦を覚悟していたのですが。
Google側に早期に判断していただいたこと&復活が早かったのは、とてもラッキーだったと思います。

「知らなかった」ではすまされなくなった。サイト運営者の責任。

今回の事件は恐ろしい体験でしたが、おかげでずいぶんと鍛えられた気がします(笑)

今後は検索順位を上げるためではなく、検索エンジンからのスパム判定対策のためにSEOコンサルティングサービスを利用しなければならない日がくるのだろうか!?
なんて頭を抱えたりして。

今回はひとりで解決まで至りましたが、運営のアドバイスがもらえる環境というのがあれば、もうちょっと安心していられたかな?と思いました。

以前、HP売上プラス(当時はビジネスプランとパーソナルプランの区別がなかった)というWebコンサルティングサービスを利用していたときは、月に1回担当者によるサイト診断がありました。

売上につながるホームページの構成方法を実際にサイトをチェックしてアドバイスしてくれるほかに、SEOスパムと見なされかねない点も指摘してくれたりして心強かった覚えがあります。

今度の事件で久しぶりに、そのことを思い出しました。

(ネットショップ向け)
「HP売上プラス」ビジネスプランの詳細
(個人・アフィリエイトサイト向け)
「HP売上プラス」パーソナルプランの詳細

関連リンク
Google ウェブマスターツール




「2008年12月の人気記事」
PC家電ブログへ
1.RICOH GX200 愛されて憎まれる本格カメラ
2.年賀状素材無料ダウンロード
3.HP Mini 1000で気になるところ
4.HP Pavilion Notebook PC tx2505/CT がそそるワケ
5.HP Pavilion Notebook PC tx2505/CT 秋冬モデル
6.無料でダウンロードできるカレンダーテンプレート
7.HP Pavilion tx2105/CTをちょっと使ってみた感想
8.Googleインデックスから削除された理由はCSSによる画像置換!?
9.HP Mini 1000 肩のこらないミニノート
10.ThinkPad X200 Tabletの実機を見てきました

コメント(3)

ゆきお様
始めまして、toshiakiと申します。
今日私のサイトをgoogleのインデックスから削除されたことに気がついて、
googleで原因を調べようと貴サイトにたどり着きました。

googleのウェブマスターツールに自分のサイトが削除された原因を示す
メッセージがあるようですが、私は探したのですが見つかりませんでした。
場所を教えていただけませんか?

toshiakiさま、

こんにちは。コメントありがとうございます。
Googleウェブマスターツールでは、ホーム画面の「ホーム」と表示されているところの直下に「メッセージ」と表示されています。
普段は「未読メッセージはありません」と書いてあります。
「Googleウェブマスターツール」>ホーム>メッセージ
という感じでしょうか。

ゆきお様
返事ありがとうございます。
場所はわかりました。
今は「未読メッセージはありません」が表示されています。

自分は違法なところを探すしかないですね。
ありがとうございました。

コメントする

記事ピックアップ

お得なThinkPad購入クーポンはこちら(PR)

ThinkPad X200 Tabletの実機を見てきました
ThinkPad X200 Tablet

ThinkPad X200 (ThinkPad vs Zippo)
ThinkPad vs Zippo?

RICOH GX200 愛されて憎まれる本格カメラ
RICOH GX200

FORIS.HD x C@T-oneが作るプライベートなアート空間
FORIS.HD C@T-one

日経ネットマーケティングの気になる中身
日経ネットマーケティングレビュー

ノートPCスタンド
ノートPCスタンド