URL+パラメーターで大変なことに!?
URL+パラメーターで大変なことに!?
【アボセンスやURL分散でのアクセス・・・面倒くさいなぁもう】の続きです。
URL+クエリ文字でのアクセスから始まった不運というか、なるべくしてなったのか、その顛末を備忘録として記しておきます。
2013/06/10追記
分かったことがもう1つ。インデックスされていたページがパラメーター付きURLになっていたことが分かった。元々、インデックスされていたページが削除か上書きされている、どうしてこうなった??上部のナビメニューからや下部のアーカイブからページを辿ればパラメーター付きURLになる。具体的にはこうです。
例(アニメ風のロゴ作成ジェネレーターまとめ 22)
■05/29までインデックスされたURL
http://prime-time.info/index.php?QBlog-20121215-1
■05/30にインデックスされたURL(クエリ文字付き)
http://prime-time.info/index.php?QBlog-20121215-1&utm_source=feedburner....略
- 途中、canonicalタグを入れたり外したり・・・この辺が問題かも!?今は使用していない。
■05/31~06/10現在 インデックスされているURL(パラメーター付き)
http://prime-time.info/index.php?QBlog-20121215-1&mode=category&catname=%E3%83%AD%E3%82%B4%E3%83%BB%E3%82%B8%E3%82%A7%E3%83%8D%E3%83%AC%E3%83%BC%E3%82%BF%E3%83%BC
http://prime-time.info/index.php?QBlog-20121215-1&&mode=archives&date=201212
ピンクの蛍光ペンがクエリ文字。水色の蛍光ペンで記してある「&mode=....」がパラメーターです。文字列の中に category がありますね、上部ナビメニューから辿ったURLです。archives はフッターにあるアーカイブから辿ったURLになります。
ウェブマスターツール→設定→URL パラメータ
ウェブマスターツール内で「URL パラメータ」 という項目を見つけて弄ってみたけど、どうなることやら・・・。ワケわからん状態です。
06/11に全てリセットした。
2013/06/10追記 2
Googleは全能では無かったんですね、クロールbotが「あれ?ここにパラメーター付きURLがあるよ!ちょろっと、このURLをインデックスしちゃおうw」などと茶目っ気を見せる時があるようです。(いい迷惑だこの野郎!)お陰で精神的大損害を被りました。
2013/06/11追記
画像はクリックで拡大します。サイトマップで送信しただけインデックスされていたものが・・・135送信のインデックスされているのが10だって何コレ?? もちろん、インデックスの削除なんてした覚えがありません!約1ヶ月前の記事がインデックスされていないので確認してみればこれが原因なのか?
インデックスの確認
インデックスされているかどうかの確認は、検索窓に“site:URL”や“info:URL”で出来ます。調べて見ると削除されたものが幾つか、それと沢山のURLがパラメーター付きになっているのが確認できた。
グーグルのペナルティ診断
ウェブマスターツールに警告メッセージが届いてるわけでもない。セーフ ブラウジング診断してみる。【http://www.google.com/safebrowsing/diagnostic?site=サイトのURL】で確認できます。
結果、手動・自動ペナルティは受けていない。
2013/06/14追記
正規URLでインデックスされていたものが、さらに加速してURL+パラメーターに上書きされている。しかも、記事タイトルが多数存在しない。検索結果にはサイト名とURL+パラメーター・・・数日のうちにアクセスが0(ゼロ)になるだろう!
こうなったら試験的に試していくしかないか!再度、ウェブマスターツール→設定→URLパラメーターを画像のように設定してみた。
mode/catname/date/cmd/tag/p/feedburner これらのパラメーターをクロール禁止に設定。ちなみに、設定がこれで合っているのかは不明。使い方を読んでみても理解できないからだ (;´Д`)
この後、Fetch as Google からサイト単位でインデックス送信した。
数日の放置プレイ・・・。
2013/06/17追記
14日のURLパラメーター設定で「クロールしない」に設定してもクローラーが来ればパラメーターを舐めるんですけど??馬鹿なの?それとも設定が間違っている?
本来このサイトはQHMというCMS(コンテンツ・マネジメント・システム)、HP作成ツールなんです。それに付随してるQblogを前面に押し出してサイト構築してみました。Qblogは、無料ブログと比べると機能的に劣る点があるのは否めない。それが結果的に裏目に出たのかも知れない。
そう思っている最中、興味津々なサイトを見つけた!
”CMSなどのメガサイトではパラメータに注意
同一コンテンツが、複数URLで表示されることは、ミラーリングや複製コンテンツなどと、いろいろ呼ばれているが、基本的にはスパムである。 また、検索エンジンの負担もある。 ユーザーも、アドレス欄を見て戸惑うかもしれない。”
思うのは複数のURLが同じコンテンツ=重複コンテンツと見なされていて、スパム扱いに!それで検索結果が圏外に飛んだ・・・。
まぁ、これは解るとして、これから如何にしてアクセスを復活させるかなんだよな。
ウェブマスターツール→設定→URL パラメータ
なんか進展があった模様。
パラメーター「Qblog」は『クロールOK』にしていたら、QBlog-20121215-1などが表示されている。何故、表示されているのか?分からない (;´Д`) マジでわからん!どうせ、アクセスが減少状態にあるのだから、もっと弄ってみることに。
黄色の蛍光ペンとピンクの蛍光ペン部分で設定を2通りにしてみた。このまま数日間、放置してみてインデックスの状態がどうなるのか観察してみます。
2013/06/19追記
ウェブマスターツール→設定→URL パラメータ
さらに、変動が見受けられた。そして、さらにアクセス減少!検索エンジンからの流入がほぼ0(ゼロ)です。
サイトの構築が悪いのかな?本来、2カラムのものをトップページだけ3カラムにしているのだが・・・上部ナビとフッターはクロールするのにサイドバーはクロールしない不思議???
もう少し、様子見。私の知識ではもう無理かも?
2013/06/20追記
1つの記事に対して4~5種類のURLが存在する。例えばコレ”ハイクオィティな画像を提供するLuc Viatourの使い方”でグーグルで検索してみると4つのURLでインデックスされている。
ちなみにこの記事は本日、正規URL(画像の①)でインデックスされた。ユーザーが検索した時に、グーグルはどれを検索結果に表示するのだろう?
正規URL以外を削除しなければアクセスの復活はないと思われる。そして、その方法を日々探しているが、まだ見つからない。教えてグーグル先生 ヽ(`Д´)ノウワァァァン!!
2013/06/20追記 2
私が有効と思えるのは、ウェブマスターツールのURLパラメーターと各ページへのcanonicalタグ設置と、ほぼ結論が出た。canonicalタグは、すごい手間がかかるなぁ、面倒くさいと言っていられなくなってきた。URLパラメーターは、今いち設定が難しい&分からない。
2013/06/21追記
なんか、増えてた・・・
ついでに、全てをこのように設定してみた。ウェブマスターツールのURLパラメーターの使い方とか解説あるけど、読むほどに分からない。検索エンジンからの流入は1件だけど、お気に入り登録から訪問してくれています。有難うございます。
2013/06/23追記
06/10~06/22のアクセス推移。100PV前後を彷徨っています。
なんか、また分けわからんパラメーターが増えてる。newwindow だってさ、なんなの一体??「クロールしない」に設定した。はっきり言って、このトラブルは自分の手には負えないかも知れない。
2013/06/21追記の設定で、もう少し様子を見て、その後canonicalタグに取り掛かろうと思う。
「site:http://prime-time.info」でインデックス数を確認すると64件、すごい勢いで減少しています。記憶が曖昧だが、確か約300あったような気がする。これが、いい事なのか悪い事なのかさえ判断がつかない。
2013/06/23追記 2
「newwindow=true」で検索してみると分かったこと。
【1】
これは廃れていってなくなる運命の属性です。すべてのTARGETを削除してください。今しばらく残るのはフレームを使ったサイトぐらいなものです。スタイルシートによるその代替はありません。訪問者に強制的な方向付けをやめる傾向なのです。ブラウザの戻るボタンを使えば済むことですから。もうすでにHTMLのバージョンによっては廃止になっています。
”すべてのTARGETを削除してください”と、これまた面倒な作業ですよ。
参照
【2】
気になるのであればrobots.txtでこのパラメータの付いたURLをブロックするか、Googleウェブマスターツールの「URLパラメータ」で「ページのコンテンツに影響しない」を設定しても良いです。rel="canonical"タグを使って、パラメータの付かないURLに正規化することもできます。
canonicalタグが最適であり最強なのか??もう、頭の中パラメーターでいっぱいいっぱいだ。robots.txtも試してみたが、やり方が間違っていたのだろう、サイトが表示されないし編集も出来ない事態になったので削除した。背中が悪い汗でびっしょり濡れた。
”「URLパラメータ」で「ページのコンテンツに影響しない」を設定しても良いです”って、コレが正当な設定なのだろうか?それじゃ、私が設定したのは間違いということになる。
2013/06/25追記
ウェブマスターツールのURLパラメータもインデックス数もあまり変化はない。何日、様子を見たらいいのか?どこで読んだか忘れたが3日とか1週間で変化が見られると書いてあった。URLパラメータを設定してから5日目、後2日様子を見てみよう。
検索エンジンからの流入は0。それでも常連さんが居てくれるのが唯一の救い。
2013/06/27追記
ウェブマスターツールの方は進展無し。なので、何となくサイトのソースを見ていたらこんなものが・・・「<meta name="googlebot" content="noindex,nofollow" />」のコードタグを発見!!これって、インデックス拒否のコードタグだよね。もちろん、私自身が記述したものではない。進入されて悪戯されたのだろうか?これが、この問題の最大のオチなのか!?
このページには、そのコードタグは無いがブログ記事のページのほとんどに書かれている。(ブログ記事の何もない箇所で、右クリック→「ページのソースを表示」で確認できます)
なんとなく、この問題が読めてきた。
- 何かのエラーか第三者によって、インデックス拒否の
コードタグが記事ページに書かれる。 - クローラーが記事をクロール出来ない。
- カテゴリーやアーカイブのページにはインデックス拒否の
コードタグが無いので、クローラーがインデックスした。 - 結果、インデックスの削除と上書きが行なわれて、パラメーター付きURLでインデックスされた。
さてと、もう少し頭の中を整理しよう!
解決できるかなぁ (;´Д`)
2013/06/27追記 2
インデックス拒否のタグは、なんとか削除できた。原因は隠しページや読み込み専用のページに記した“noindex”がブログの記事ページに反映したことで起こった現象。それらの該当ページを削除と“noindex”を削除で対処できた。何故そんなことが?私に解るワケがない。
それと不具合が1つ発生した。ナビの「フリー素材」をクリックすると読み込み専用の広告(忍者ad)が表示されてしまう。これも、後々対処しないと駄目だな。
しかし、色んなトラブルが発生するなぁ!?
ウェブマスターツールの方は相変わらず進展が無い。サイトマップ送信とFetch as Google からインデックス送信して、数日間の様子見。
2013/06/29追記
インデックス拒否タグの件
インデックスされないように隠しページを作ったにも関わらず、インデックスされ検索結果に表示されてしまった。インデックスしないように“noindex”を記述。その隠しページをincludeプラグインで読み込んでいたためにブログ記事のソースに反映していた。というのが真相です。要は私が無知なだけだった (;´Д`)
インデックス数が約30ほど増えている。しかし、正規URLとパラメーター付きが混在しているんだな。ウェブマスターツールの方ではパラメーターを「クロールしない」に設定しているのだがクロールする不思議?適当というか絶対ではないようですね。
2013/06/30追記
減少したインデックス(されたページ)の中に隠しページがあるのを偶然に発見。これは駄目だと思い急遽“noindex”を記述。それが、アクセスとインデックス激減の最中だったからURLパラメーターとは別問題。
久しぶりに数件ですが、検索エンジンからの流入がありました。インデックス数が微増ではあるが増えている。現在は約150件。
2013/07/02追記
06/23~07/01のアクセス推移の画像です。インデックス数は、まだパラメーター付きが多いですが約200と大躍進です!!
ウェブマスターツールのURLパラメーターには変化がない。パラメーター設定は、このままでいいのかな?インデックス数は増えているし正解なのかも!?しかし、何が起こるか分からないので監視は怠らないようにする。canonicalタグは、できれば使いたくない。まだ、正確に使い方が把握できていないから。
海外からの怪しいアクセスがしつこい件・・・。
2013/07/03追記
GoogleのWebサービスにある「Feed burner」というのをご存知でしょうか?事の発端は、「Feed burner」経由のアクセス。
【http://prime-time.info/index.php?QBlog-20121215-1&utm_source=feedburner....】
このURLでのアクセスから悲劇は起こりました(大げさかな?)
私自身は「Feed burner」のサービスは利用しておりません。ですので「Feed burner」のことはさっぱり分からない。ただ言えることは、人のサイトのURLに他人が「Feed burner」経由のURLを付与できるという点。(言い方がずれてるかも知れません)
前置きはここまで。何が言いたいかというと、クローラーbotがまた「Feed burner」経由のURLを拾って(インデックス)しまった。現在、一生懸命アクセスを立て直そうとしているのに「Feed burner」の所為で努力が無になってしまうのではと懸念しております。
ウェブマスターツールのURLパラメーターで、この類は『クロール』しないに設定済み。にも、関わらずクロールしてインデックスしてしまう体たらく。
2013/07/06追記
ウェブマスターツールやら、何やら嘘偽り無く綴っております。ですが、頓珍漢なことなど書いてると思われるので簡易的なコメント欄を設置してみます。「それってマジなの?」とか批判、ツッコミ等など大歓迎します。まぁ、見ていてくれる人は極々少数なんですけどね。現在は700PVあたりをウロウロしております。
コメントが無いのと管理の問題でコメント欄は07/22に削除しました。
2013/07/07追記
サイトマップで送信したインデックスも順調に登録数が増えています。2013/06/21追記で設定したURLパラメーターも、さほど間違いはないのかトラブルも無く順調にアクセス回復に向かっている。
07/02~07/06のアクセス推移。インデックス数が増えて更新もしていけば元のアクセス数(900~1200PV)に戻るかも。
2013/07/09追記
アクセス数は横這い状態。これといって記すような動きもない。後、少しでこの日記も終わりそうです。
2013/07/13追記
ウェブマスターツールから重要なメッセージとして届いておりました。URLの「www付き」と「www無し」を又蒸返してるのでしょうか!?こちらでURLの正規化をきちんとやっているのになぁ。『「www付き」もサイト登録せなアカンで』言うたのお前やん。手立てが思いつかないので放置することに! (;´Д`)
2013/07/14追記
07/07~07/13のアクセ推移。相変わらずの横ばい状態、たまに800PVを越えるくらい。全ての記事が正規URLでインデックスされたら、元のアクセスになると予想してみる。不安となる要素が残っていますが・・・。
「Googleの方針に背かずに、ユーザーの求める情報を提供し続ければSEOなどの対策はいらない」と何処かで読んだし、信頼している人もそう申していた。今でもこの言葉は揺ぎ無いもので信念としてある。だが絶対とか100%では無い。予想だにしない第3者やアクシデント(?)により今回のような事が起こりうるということ。
ウェブマスターツールやアクセス解析で不穏な動きを感じたら、即座に調べて対処法を考える。SEO素人が生意気なことを言ってみました。
2013/07/18追記
URLパラメーターの設定も、こんな感じで正解かと思われる。PV数も若干、伸びています。
しかし、よく復活出来たなと思いますよ。やって見ればどうにかなるもんですね。他にも、趣味の音楽サイトがパンダアップデートで圏外に吹っ飛んだことがあります。コツコツと修正していったら、こちらもアクセスが復活しましたよ。7ヶ月もかかりましたが (;´Д`)
2013/07/22追記
07/14~07/22のアクセス推移です。何事も無く順調といたところか。後少しで全てのページがインデックスされます。一応ここで顛末日記を終わりたいと思います。また、何かしらトラブルが発生した場合に再開するかも!?再開は(トラブル)したくないけど。
a:4340 t:1 y:1