ホーム > タグ > IP

IP

百度(Baidu)のクソっぷりが止まりません

ちょっと久しぶりですがいつまで経ってもクソな百度について変化が起きているので、書きますね。

220.181.7.75 # baiduspider-220-181-7-75.crawl.baidu.com - Referer無し - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) - zh-cn,zh-tw
220.181.7.87 # baiduspider-220-181-7-87.crawl.baidu.com - Referer無し - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) - zh-cn,zh-tw
220.181.7.88 # baiduspider-220-181-7-88.crawl.baidu.com - Referer無し - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) - zh-cn,zh-tw
220.181.7.95 # baiduspider-220-181-7-95.crawl.baidu.com - Referer無し - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) - zh-cn,zh-tw
220.181.7.124 # baiduspider-220-181-7-124.crawl.baidu.com - Referer無し - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0) - zh-cn,zh-tw

今これだけのBaiduspiderが3日間の間に来てます。IPの国籍は中国になっているので、これって
本国のクローラーですね。IPの国籍が中国なら、私のこのブログは中国を完全規制しているので
蹴っているから良いんですが、今の所この百度のCIDRエリアを調べたけど分かりませんでした。
それで、この百度を含んでいる中国のCIDRはもちろん分かりますよ、220.160.0.0/11ですからね。

日本の百度が今クロールしてるのかって前に制御してしまったから、今来ているのかどうかさえも
知らなかったんだけど、そしたら今度は本国から堂々とクロールしに来ますか。また相変わらずの
クソっぷりで。今丁度Googleの中国問題が話題になってるって言う時に、空気読まずにこれか…
検閲なんかしてる中国ごときに私のブログなんて見に来て欲しくないんだよ、Googleと一緒でね。

あ、ホントに出来た

いきなり変なやる気が出てきたのでやってみたら…1回の文法ミスもなく成功してしまったんだが。

前のエントリーでサブドメインをイジった事を書きましたが、全然トラブルが無かった訳じゃないの。
実はドメイン変更でFirefoxのブックマークを直してたら、押さなくても勝手にブックマーク飛ぶのね。
おかげで全プログラムを勝手に実行しちゃって、IPリストのデータがかなり変になってた。その中で
おかしくなってたのは、日本のIPリストにあたるCIDRが2重になっちゃったの。それでこれを直す為
に考えたのがCIDRの更新なんだけど、今までもCIDR更新プログラムはちょっと作った。作ったけど
見事に失敗して動かなかったのよ。それで今回、修正用に新たに1から作り直して動かしてみたら
あっさりと動いてしまった!私ここ何ヶ月?とCGIイジってないから、もうほとんど忘れかけてたのに
1個の文法ミスなく動いたってのは自分自身でも凄いと思った(笑)もちろんちょこっとバグはあったが
少し考えたらすぐに取れた。あっさり出来てしまったんで調子に乗って今度は試しに中国のIPリスト
を取ってきて更新してみた。これも見事に成功!おぉ、たった20行くらいのプログラムを30分くらい
で作ったけど、こんなに優秀だとは思わなかった(笑)これでIPリストの更新が極めて楽に出来る~

中国の2重規制解消

何かただひたすらに突っ走って規制してたら、中国を2重に規制してて.htaccessが大きくなった。

前に書いたけど、まず中国のIPリストを吸わせて、次にスパムIPリストを吸わせて、それら全てを
そのまま.htaccessに出力してた。スパム送ってるのは中国が多いから、中国IPリストのCIDRと
スパムIPで2重に規制してたと。今また、ただでさえデカくなってきてる.htaccessだったからねぇ。
んで、これを解消出来たのは実は偶然だった…エラー情報収集CGIの仕様変更の時に、何となく
後々何かに使えるんじゃないかなと思って、スパムIPリストの中の中国IP分だけ、属性付けてた。
それを今回から、出力する時に中国属性付いてる分は.htaccessに出力しない様にしてみたら…
あ~らビツクリ!2重規制が解消されちゃったわぁって感じ(笑)そうか!これが棚からぼた餅かぁ!

まだもう1つ、エラー情報収集CGIのアップグレードが残ってるんだけど、今でもすでに相当スパム
処理については楽になった。もうほとんど無視状態に出来てる。まぁ中国のアホ共がこのブログに
何しようが無意味なんだけどね。残念ながら、私の頭脳の方が2歩ぐらい先を逝ってるからねぇ~。

規制整理途中経過

エラー情報収集CGIアップグレード4はかなり大掛かりになるんで、気休めに他の事をちょこちょこ。

ずっと前から早くなんとかしなきゃいけないなと思ってたけど、手が出し辛かった事を解決してみた。
えっと、asahi-net.or.jpをほぼ全面的に規制していましたが、これ規制してた理由がちょっと複雑で
なかなか解除出来なかったんですよ。これ他にも5,6個のプロバイダが絡む懸案事項の為の規制。
で、その懸案事項を解決する方法を適用するとして、asahi-net.or.jpのドメイン規制とCIDR規制の
2つを条件付きで解除しました。IP規制はもちろん規制されたままです。このasahi-net.or.jpの人が
見れる条件と言うのは、リファラが入ってないと見れません。今はこの条件が無いと規制外せない。

それとIPリストを整理してて常に思うのが、プロバイダの良し悪し・努力してるかって結構分かるよ。
IP見ただけで都道府県が分かるのってホントに助かるし、規制による影響も極力減らせるからね!
ちゃんとこれやってくれてるとこは良いけど、大所帯なクセにこれやってくれないプロバイダもある…
こう言うとこは、誰か1人でもスパム送信とかで悪い事すると、全員が一気に規制喰らっちゃうのよ。
一番代表的なのがdion.ne.jpとhome.ne.jpかな。この2つのプロバイダ使ってる人は特にご注意を。
エリア絞込みとかで規制出来ないので、全員一気に規制かかると言う最悪のパターンになるから!

ちなみにdion.ne.jpはasahi-net.or.jpと同じ条件を適用して解除予定なんですが、home.ne.jpの方
は今も昔もスパムが酷過ぎるので解除する気毛頭ありません。今リファラスパムも来ているぐらい。

目には目を、埴輪ハオ、スパムにはスパムを

変なタイトルですが何て事はありません、内容的にはエラー情報収集CGIアップグレード3の事。

第3次アップグレードでは、ずっとやりたかった事がやっと実現しました(笑)リファラスパムってさぁ
当たり前だけど、そのリファラ先のサイトに来てほしいんだよね?だからいちいち無駄だって言う
のに懲りもせずリファラスパムやってるんでしょ?だったら…行ってやるよ(笑)私じゃないけどね!
そこでタイトルにある様に、スパムにはスパムを。と言う事で、今このブログに物凄い来てる中国
からのスパムやリファラスパム送ってるバカ含め、みなさんをロケーションを使ってリファラスパム
で指定されたサイトに吹っ飛ばしてやる事にしました(笑)そう、スパマーに逝ってもらう事にした!

昔っから言ってるけどさ、私のブログは集めた情報量が半端じゃない上に、当然リファラスパムの
情報も蓄積されてます。んで、リファラスパムのリファラ情報をデータ化して、ランダムに送り出す
システムを作ってみました。前のリファラスパムにロケーション喰らわせる事が出来る様になって
から、ずっとこれやりたかった!リファラスパム送ってるバカ、サイトに来てほしかったんでしょ?
だからウチに来たスパマー全員そっちに送りこんでやるから、有り難く思え!良かったねぇ( つД`)

百度(Baidu)とアメブロへのリファラスパムがウザ過ぎる!

最近でも百度と、訳分からん誰か知らんアメブロへのリファラスパムがもぉ酷くて酷くてウザ過ぎ!

百度は言わずと知れた、DoS攻撃ボットを動かし、robots.txtを守らない中国のクソ検索サイト…
百度は今更言わなくてもすでに悪名高い訳だから、どーでもいいんだけどぉ。日本に進出してさぁ
日本3位の検索サイト目指すって大ホラ吹いて、結果は言うまでも無く一般的に知名度0のまま。
それより、相変わらずサイトへのDoS攻撃は続けていて、検索サイトの技術なんてありゃしない!

そして最近特に酷い、アメブロからのリファラスパム。私ちょっと前にリファラスパムの事書いてさ
システムレベルで飛ばしてる!って言ってるのに、バカの1つ覚えか、猿の様に連日来やがるし。
今回のこのリファラスパムのIPはbbiq.jpです。このブログは昔からbbiq.jpからのスパムが来て
いるので、昔っから永久規制しています。まったく解除さえする気が起きない程bbiq.jpは酷いよ。
一番最初だけ都道府県が分かるIPで来てて、その時は佐賀県の光。その後は不明なIPばっか。
さらにこれをわざわざアメブロに通報してやったんだけど、全然聞く耳持たないみたいね。だから
アメブロって嫌いなんだよ!ブログ広めておいて、管理しきれてないならブログ広めんじゃねぇ!

ちょっと緊急で中国IP規制

何か今日になってから急に中国から大量のアクセスが来てるので、緊急で中国IP規制しました。

中国のIPリストは今日取ってきたので、間違い無く最新版です。前に国外IP規制をすると言った
気がしますが、まだしていません。ちょっと考えてると言うか悩んでる部分があって、してません。
ただその代わり、.htaccessを作るCGIの方はちょっと改良を加えて、中身は凄い事になってる!
外部からIPリストを吸わせて整頓して.htaccessに反映させると言う機能を実は付けてみたのよ。
これが意外と役に立つ!特に今回みたいな緊急で規制する時など、即座に対応出来るからね!

でも急に中国から殺到してきてる理由はあれか?ちょい前に書いた百度のエントリーが原因か?
まぁそぉじゃなくても未だに中国からスパムが大量に来てるから、結局無価値な国なんだけどね。

ダメだ、負荷が減らない

ちょっとWP Super Cacheとかを使って負荷率を減らそうとしましたが、ほぼ効果がありません。

多分さ、WP Super Cacheを使っても最初の判断する時点でPHPが動いてしまってるだろうから
ほとんど意味無さそうな感じね。それで考えたのが、Googleボットだ。ログ見てて思ってたんだが
Googleボットが恐ろしい数来てる。前のMovable Typeの時は静的ページだったから、どれだけ
来られたって負荷発生しないけど、今のWordPressは動的ページだからね。来られたら来ただけ
どんどん負荷発生するんだよねぇ。それで、Googleウェブマスターツールの方でGoogleボットの
動きを最小にまで抑えました。それによって減ったかな?って感じの値にはなった。なったんだが
また今日になって負荷率が1000pt超えてるorzもう、一体どうしろって言うのよ?訳分からんわ!

前に国外のIP規制を外したせいか、また国外からの変なアクセスが頻繁になってきているからね。
そして前に宣言してた新.htaccessの一部、2009年4月版の日本のIPリストがついに完成した!
なので、またそろそろ規制を逆転させます。国外のIPは、近日中にアクセス規制をかけますので。

やっとスパム判断関数が動いた

システムをWordPressにしてから、実はスパム判断関数が機能してなかったが、やっと動いた。

スパム判断関数が機能してなかっただけで、ちゃんとエラー情報収集CGIの方は動いていたが。
最近、ロシアの194.8.74.0/23から強烈なスパム攻撃が来ているんだけど、サイドバーの方にも
表示してるSpam Comments Blockedの内、約8割はここから来てると言ってもいいんだけれど
あまりにも同じIPからばっかりずっと送り続けてるから、いい加減ウザくなってきてIP規制かけた。

IP規制をかけると今度はエラー情報収集CGIが拾い始めるんだけど、実はこのスパムの情報が
結構役に立つのよ。今新たに作ってる新.htaccessの規制に使おうと思ってるデータがあるけど
ちょっと信頼性に欠ける点がある。そのデータの中から確実なものを見つけるのに、このロシアの
スパムが一役買ってくれているのよ(笑)だから私ちゃんと言ったじゃん、ハニートラップだって(笑)

そして、このスパム判断関数が機能してくれると私の苦労は一気に減る。これで新.htaccessも
新機能を採用して使える事になるな。さぁアホスパマーよ、私にどんどん情報を授けるがいい(笑)

p4171-ipbf217hodogaya.kanagawa.ocn.ne.jpは何だ?

ここ最近p4171-ipbf217hodogaya.kanagawa.ocn.ne.jpから酷いボット攻撃を受けてる。

動きは秒間1ページなんだが、これがかなり連続してて、2時間おきに来ている感じかな。それで
RefererとLanguageが無くて、UserAgentは至って普通だから、なおさら性質が悪過ぎるわ!
クローラー行為するなら、ちゃんとそれなりに正体を表してからやれよ!昔っから言われてるけど
OCNはホントにクソな奴が多過ぎ!スパムと言えばOCNって言われてるくらいなのにねぇ!(笑)

Home > タグ > IP

検索
フィード
メタ情報

Return to page top