トップ «前の日記(2005-10-26 [J]) 最新 次の日記(2005-10-31 [J])» 編集

Eroge RSS Checker 運営記録

Categories | メモ | 運営 | 感想 | 記号変更 | 雑記 | 雑文 | 思案

合計: 今日: 昨日:
2005年
10月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31

rss1.0

ここは、「Eroge RSS Checker」に関する運営の記録を書きとめておく場所です。第三者に説明する文体で書いていますが、大半は備忘録です。

  1. スクリプトを汎用化して公開する。---最終目標
  2. CSSを論理的に使う。---努力目標
  3. デザインを改善する。---努力目標
  4. 攻略の完全・不完全を出来る限り判別する。---努力目標
  5. 管理要員用のページの充実。---努力目標
  6. JANコードの入手先を探す。---躊躇中
  7. ブランドの複数登録。---大規模改修のとき
  8. 登録を簡潔にしつつ、marker登録を半自動化する。---暇なとき

2005-10-27 [J]

_ [メモ] 検索スクリプトの進行状況 独自・タイトル・ブランド・サイト終了

上記4つが動作確認済み。残りは手を付けていませんが、今日の夜にでもやります。

_ [メモ] MySQLのデフォルト文字コードの変更の影響

通常バックスラッシュで特殊文字を通常文字として認識させる。ただMySQLでは(/n)などを認識するため、二重にバックスラッシュしないとならないらしいが、PHPに専用の関数はないので、作らないとならない(非常に簡単だけれど)。

_ [雑記] 検索の利便性

今まではやってこなかったが、全角半角の差異は吸収した方がいいに決まっている。出来ればカタカナ、ひらがなの差異も吸収したい。ついでに、雑多な記号は全て無視するとなお良い。ただ、英単語の読み仮名はさすがに無理だが。

というか本当ならこれらはやっていて当然のことだろう。例えば、「ゲーム攻略への道」さんでは、英数字を必ず全角にしている。日本語環境以外から判別しにくいようにという意図だろう。そういえば、「Japanese only」と全角で表示しているサイトが昔あったらしい。

とにかく、まとめるべきだ。本当は当サイトでも統一していたのだけれど、拡張を進めるうちに、それがしっかりとされていない部分があったらしく、全角英数字が混じれ込んでいた。そこの所をどうにかします。

_ [メモ] 巡回スクリプトのバグ

まだバグがありました。分類の補完、複数分類の分離部分が問題で、登録サイトのレイアウト変更に対応すべく、四苦八苦している途中で見つけたわけです。まだ、あるかもしれません、バグ。

_ [メモ] スパムツッコミ

この頃、スパムツッコミが多くて困ってました。そこで、「最近多発しているツッコミspamへの対策」の通りに実行。これで、今のスパムは回避できるはず。でも、スパムの問題はスパムをする方が得だからなんですよね、引っかかる人がいて、規制もすくない(とはいえ、アメリカ、日本でも携帯などでは問題になり若干対応されています)。

_ [雑記] アクセス数

4月24日からの登録サイトへのアクセス数の推移を調べてみた。

合計857624

10月158102(11月1日計測184044)

09月166436

08月169549

07月136095

06月107929

05月119513

伸びているような、伸びていないような。大学生の休み期間中にアクセスが増えるのは当然のことなので、まぁ伸びているのかも。

_ [思案] アクセス数を使った厳選サイトのみの表示の実現

始めた理由とはかなり離れてしまいますが、サイト、ゲームタイトルのペアのアクセス履歴を残すと、不人気サイトの割り出しに役に立つので、やってみてもいいかなと思い始めています。上のアクセス数からも分かるように数ヶ月で数十万もしくは数百万のデータになりますが、限定的に利用すれば、日に一度だけ定点データを抽出するといった使い方であれば、重くとも問題ありませんし、厳選サイトのみを表示して欲しいという要望も根強いので。

ただ、個人的には不人気だから内容が良くないだとかそういうことはないと思いますし、用途によってサイトの良し悪しは変化すると思っています。アクセス数は、そうでなくとも偏りますし、不人気サイトにとっては機会自体が失われる事になりますから。

さて、では実現方法を簡単に書いてみます。

記憶するデータは、「アクセス日、ゲームID、サイトID、重複チェック項目」の4つになります。これを利用してデータごとの人気を割り出します、簡単に、「同一分類・タイトルのアクセス数の占有率」を割り出すのがいいのではないかと思っています。それを、全登録データで1日1回、直近1ヶ月ほどのアクセス履歴から計算し、記憶します。後は、フィルターで占有率何%以上を表示するというようにすれば、表示の自由度も上がりますし、登録データの多いサイトが有利だったり不利だったりということは起きません。

アクセス数が少ないか全くないタイトル、データについての取り扱いや、このフィルターによるアクセス数の格差の増大なども起きるかもしれません。それに、自作自演での人気取りの危険性もあります。

「君子危うきに近づかず」という言葉があります。ですが、これは明治期に作られたもので、孔子は真逆のことを言っています。まぁ、それは関係ないのですが、こういう刺激もあってもいいかな、とこの頃思うようになりました。

お名前:
E-mail:
コメント: