トップ «前の日記(2005-05-21 [J]) 最新 次の日記(2005-05-23 [J])» 編集

Eroge RSS Checker 運営記録

Categories | メモ | 運営 | 感想 | 記号変更 | 雑記 | 雑文 | 思案

合計: 今日: 昨日:
2005年
5月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

rss1.0

ここは、「Eroge RSS Checker」に関する運営の記録を書きとめておく場所です。第三者に説明する文体で書いていますが、大半は備忘録です。

  1. スクリプトを汎用化して公開する。---最終目標
  2. CSSを論理的に使う。---努力目標
  3. デザインを改善する。---努力目標
  4. 攻略の完全・不完全を出来る限り判別する。---努力目標
  5. 管理要員用のページの充実。---努力目標
  6. JANコードの入手先を探す。---躊躇中
  7. ブランドの複数登録。---大規模改修のとき
  8. 登録を簡潔にしつつ、marker登録を半自動化する。---暇なとき

2005-05-22 [J]

_ [雑記] 掛かる時間とその割合

2005-05-21 23:58:22 取得22秒 / 登録22秒 / サイト数(最終更新日)46 / サイト数(GET)19

2005-05-22 00:06:32 比較終了512秒

2005-05-22 00:06:36 全処理終了516秒

時間の掛かり方を調べたらこうなっていた。少し前に書いた、「逆検索」のために掛かってしまっている。ので、仕方ないので、比較元、比較先を配列にして「preg_grep()」で検索をすることにした。そうすると数秒で終了する。分かっていた事とはいえ・・・・さくらさんのMySQLは激しく遅い(ただ、遅くなくとも何倍かは違ってくるはず)。

_ [雑記] 文字コードの自動判別

「jcode」の自動判別では分からないサイトで出てきた。そこで少し調べた所、文字コード特有の文字列があるかどうか調べているだけらしい。要するに、特有の部分がなかったら判別が出来ない。試しに標準の判別関数の「mb_detect_encoding」を使った所正しい文字コードを検出してくれた。

一体なぜか?今回は広告部分の文字コードと本文の文字コードが違う事が原因のようだ。「mb_detect_encoding」で何故認識できたのかは謎。「ゆるい」判別でもしているのかと思い、検出順序を最後にしても正しく検出されたので何か別のロジックが働いているのかもしれない。予備として、「jcode」で判別できない場合は、「mb_detect_encoding」を使う事にした。

ついでに書いておくと、文字コードの判別は、UTF-8などは簡単だけれど、いつも間違う可能性がある。重複した実体を使っているため、ある文字コードでも可能だし、違う文字コードでも可能だからだ。

mb_convert_encoding/mb_detect_encoding について』のような問題もあるようです。

_ [雑記] 始まって以来、最高の暴走

30分近く、暴走していたようです。憶測、もしくは問題箇所は分かるのですが、何故か、はデータが失われてしまったのでどうしようもない。いまから少し調べてみる。

ということで調べてみたら、変なサイトが登録(もしくは既存データのコピー?)してあり、そのサイトの登録データが一文字の記号だったために、ID検索で負荷をかけたらしい。

同じ事が起きても、同じような事態にならない程度には対策を採ったが、明日にでももう少しきちんと見てみよう。

お名前:
E-mail:
コメント: