トップ 最新 追記

Eroge RSS Checker 運営記録

Categories | メモ | 運営 | 感想 | 記号変更 | 雑記 | 雑文 | 思案

合計: 今日: 昨日:
2005年
1月
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31

rss1.0

ここは、「Eroge RSS Checker」に関する運営の記録を書きとめておく場所です。第三者に説明する文体で書いていますが、大半は備忘録です。

  1. スクリプトを汎用化して公開する。---最終目標
  2. CSSを論理的に使う。---努力目標
  3. デザインを改善する。---努力目標
  4. 攻略の完全・不完全を出来る限り判別する。---努力目標
  5. 管理要員用のページの充実。---努力目標
  6. JANコードの入手先を探す。---躊躇中
  7. ブランドの複数登録。---大規模改修のとき
  8. 登録を簡潔にしつつ、marker登録を半自動化する。---暇なとき

2005-01-06 [J]

_ [雑記]新年

あけましておめでとうございます。と書いてみるがそういう風習には疎いもので、いつのまにかの新年です。開設して半年未だ、スクリプトの配布の目処もたちませんが、今年こそはなんとかしたいと思います。

_ [雑記]表示エラー報告ボタンを押すのは?

「表示エラー報告ボタン」というのは今で言うページ下部の「エラー報告」のこと。以前は押すとページのアドレスを記憶するだけのシンプルな作りだったが、毎日10回近く押される。全てチェックするのだが、エラーを発見出来るのは数日に1回あるかないか。何か変だとIPアドレスを記憶して変な事をしている人はいないかと眺めてみたら・・・・・いなかった。どうも、押してみたい衝動に勝てない人や、データがない場合エラーだと思っている人、目的のデータが無かった人などが間違って(故意に)押しているらしい。ということで直ではなくワンクッション置いてエラー報告を登録することにした。javascriptでも使えばもっと簡単で便利なのだが、有効にしていない人もいるので全てphpでやってみた。

要するに、ボタンの置き方、見せ方で有効に機能しない場合があるということだろう。

_ [雑記]リンク集と広告

リンク集の運営、特に労力を必要とする場合、広告、収入は必須だと考えている。リンク集に求められるのは何か?持続した保守管理とデータの速報性、正確性だ。収入にもならないリンク集の運営を何年も続けられるだろうか。もし仮に時間に余裕が出来、収入に不安のない暇な仕事にありつけたとしても、そのリンク集に意味を見出し続けられるだろうか、人の趣味は変わるものだ。変わってしまったら、そのリンク集を運営する事に何のメリットもなくなってしまう、結果閉鎖ということにもなり兼ねない。事実そういった理由で閉鎖してしまったリンク集も多いだろう。だが、そのリンク集が最大手だったら多くの人が類似のリンク集を探し出さなければならない。その労力は大変なものだ。登録サイトも同様に自分のサイトの入り口を探さなければならない。今まで築き上げてきたコミュニティーが崩壊してしまうわけだ。

理想的には、内容を次の人にバトンタッチ出来れば、最高なのだがそれほどの交友関係を築いていなかったり、レンタルサーバーなどの費用、契約の問題があったり、自分の仕事、実績を他人に無償で渡す事への抵抗感がありそう上手く行っていないようだ。Wikiのような自由にだれでも書き換え可能なものもあるが、確実性や統一性の確保が難しい。多人数運営ではこれらがネックになってしまう。これらを乗り越えられるならそれが一番だろうが、これと広告を入れることとは方向性が違う。

広告を入れれば収入が得られて簡単にやめはしないだろうし、訪問者を獲得するために努力もするだろう。実は一番確実なのが法人が運営する事なのだが、それだけのメリットがないのか、個人サイトへのリンクに許可を求めたり色々と面倒が起こるかもしれないためか、法人が個人運営のリンク集と同等のものを作成運営しているというのはあまり聞かない。

「趣味としてリンク集を運営しているんだ」とか「自分のコンテンツをどうしようが勝手だ」とか「興味が無くなっているのにお金目的で運営しても上手く行かない」とか色々考えられるが、今日は眠いのでここまで、後日もう少しきちんと書くことにする。

_ [雑記]最近のヒット数

最近、検索エンジンでの評価が上がり登録ページが増えたせいかヒット数、訪問者数がうなぎ上りに増えている。一昨日からデータによっては訪問者数が3000を超えている。まぁそれでも、インデックスページにはそれほど来ないので表面上の変化はない。

_ [運営]巡回アドレス変更

「紫羅蘭のお部屋」は更新履歴を巡回していたのだが、変更が遅れているため確実なインデックスに変更した。

「エロゲー倉庫(管理人)」は2005年になったのでファイル名が変更したため。投稿の方も更新され次第変更予定。

_ [記号変更]『BREAKTHROUGH』

開始記号 size=-1>● → >●

取得洩れが生じたため。dateも取れなくは無いが、保留。


2005-01-07 [J]

_ [運営]RSSの是非

後で詳しく書くととして一言。

個人的には嫌いだが、リンク集の管理人としては大好きだ。RSSのような規格はネットのリソースの有効利用のためには必要なものだと思うが、それは各ユーザーが対応するものではなく、サーバーサイドなどで一括して対応するようなそんなシステムになってからの話だ。

_ [雑記]手書きのRSS

手書きのRSSに間違いが目立つ。日付がずれていたり、リンク先が違っていたり、タグを閉じ忘れたり、1行目の始めが空白で始まっていたり、中には大した影響のないものもあるが、やはり手書きで間違いをなくすのは難しそうだ。

_ [運営]『Undying Memories』の取得洩れはウチのせい

どうも見なおしたら、きちんと日付通りに更新していて、取得可能な状態だったようだ。面目ない。

なぜ取得出来ていなかったのか?実は良く分からないのだが、1個所タグの最後に>を付け忘れていることが関係しているのかもしれないが、良く分からない。もしかすると取得すべき日付にエラーがあり途中で取得作業が中断してしまったのかもしれない(現在のシステムだと次の更新まで取得不可)。

_ [運営]準管理人募集要項

なんの見かえりも用意できないが、募集してしまった。やることは今自分がやっていることと大した変わらない、内容は以下の通り。

1、自動で出来なかったIDを登録する。

2、取得洩れがないかチェックして、あれば原因を確かめ、改善する。

3、不正な処理に対する対処(現在無いといってもいい)。

これだけ。管理人としての仕事として、改良や改善、登録サイトの増強などもあるがこれは気が向いたとき以外は必要無い。

で、この3つの作業にの内1はだれでも可能。ただ1の作業の即決権限を持っているのは管理人だけ。特別な知識はほとんんどいらないのだが、登録サイトの形式が変わったとき正規表現が分かっていないと対処できない可能性がある。まぁ初歩レベルなのでネットで検索したり、既存のものを見れば大抵できるはずだがこれがネックになりそうだ。時間もそれほど掛からず、簡単なので誰かやってくれないだろうか。

報酬としては、出来てもサイト持ちの人なら目立つところにリンクを張るとか、ブログまがいのコーナーを作ってあげるくらいしか出来ないのでちょっと心苦しい。

_ [記号変更]『えるのエロゲ倉庫』

開始記号 「 → 「(?=<)

やったエロゲも取得してしまったため。


2005-01-08 [J]

_ [雑記]分かりやすさとデータ項目

この二つは両立しないように感じる。

分かりやすさを追求すればデータ項目別に整理表示することは出来ない。ぱっと見て理解できなければならないからだ。昇順、降順などの並べ替えも出来るだけ無い方がいいだろう。例えばゲームについて、発売日、スタッフ、ブランド、○○サイトへのリンク、扱っているレビュー・攻略・改造サイト、コメント、得点・・・etc、と多くのデータがある場合それを1画面に収めるだけで大変で、しかもそれを分かりやすくすることなど不可能だ。重要度により目立つようにしたり、配置を工夫しても、少なくとも1度良く目を通さなければ分かりはしないだろう。

アイデアや設計次第ではあるが、現実問題データ項目が多いのに分かりやすく表示しているサイトを見たことはない。もしあるなら参考にしたいので是非教えてもらいたい。

なぜこんな事を書いているかというと分かりにくいという指摘がサイト、登録ともに何度も寄せられているからだ。弁解というわけではないのだが、一応一般論を書いてみた。

_ [雑記]オブジェクト指向

正直いまいち言葉の意味は分からない。感じとしては、変数群をクラスとして扱い、スクリプトを関数化して、流用をしやすくするものとして受け取っている。例えば、巡回、取得段階で使う変数群をクラスとして扱えば、MySQLに依存することなく、CSV、PostgreSQLなど他のデータベースを使用することが出来るようになる。他にも要所要所で再利用が可能で、多少違っているものは一つにまとめられて、無駄を省くことも出来る。

実際問題、そうしないと機能の向上を図りづらくなるので勉強してなんとかしたいが・・・・これ設計者の良し悪しがプログラムの良し悪しに直結するほど設計者次第なものなので、センスのなさには自信のある自分としてはちょっと躊躇している。


2005-01-09 [J]

_ [雑記]Last-Modifiedを使った更新チェック

日付の書き方というのは非常に厄介な問題だ。米国式、英国式、各国で書き方が違う。しかも、どこの国か分からなければ正確な日付がわからない場合もある。

それとはまた別の話でGMT(グリニッジ標準時)とローカル時間(?)がある。日本なら9時間の差があるわけだが、これが今回のLast-Modified関係の挙動の間違いの元になっている。

まず、更新された場合その日時が記録される。その日時とLast-Modifiedを比較して更新日時より最近ならテキストデータを取得する。で、そのテキストデータを記録してあるテキストデータと比較して違うなら更新する。

問題は、記録される更新日時とLast-Modifiedの形式の違いにある。更新日時は「1901-12-14 05:45」といった形式で、Last-Modifiedは「Fri, 13 Dec 1901 20:45:54 GMT」という形式になる。それを統一するためUNIX タイムスタンプに変換して比較する。両方とも日本においては同じ時刻を指しているのだが、PHPのstrtotime関数では前の物はローカルを基準にUNIX タイムスタンプに変換される。後ろの物は書かれている通りグリニッジ標準時で変換されると思いきや親切にもローカルを基準に9時間プラスされたUNIX タイムスタンプに変換される。ここを9時間プラスされないと勘違いしてしまい、更新されていないのに更新したと判断し毎回無駄足を踏んでいたわけだ。

実はこの方法は、サーバーの設置場所ローカルの設定によっては実際とは違った結果が生じたり不具合も考えられるがこれしか方法がないのだから多少のことはしょうがない。

If-Modified-Sinceで更新チェックすればもっと相手のサーバーに負荷を掛けないのだが、その方法(他人のスクリプトを見て少しは理解したけれど)や対応状況がいまいち分からないので上の方法で更新チェックしている。


2005-01-10 [J]

_ [雑記]favicon.ico

IconEditor LittleCanvas

http://www.ric.hi-ho.ne.jp/many/

これを使って作ってみました。32x32アイコンは結構良く出来たと思うけれど、16x16アイコンは小さすぎてなんにも書けないのであんな出来。

_ [メモ]If-Modified-Sinceで更新チェック

http://ns1.php.gr.jp/pipermail/php-users/2004-June/022462.html

を見る限り、fputsを使えば対応できすような気がする。

ただ、手数が大きくなるだけであまり利点はないような気がする。


2005-01-11 [J]

_ [雑記]助っ人用ページの作成状況

結構大変な作業だといまさらながら分かった。のろのろ作業しているとはいえ、holyseal_idの登録部分とユーザー登録IDを無効化する部分のみで10時間近く掛かるとは・・・。後は、ErogameScape_IDの即決、登録情報(記号など)の訂正、1週間程度の取得データの訂正を出来るようにすれば形は出来上がる。

低機能な気もするが、もう少し形が出来上がり使ってみないと分からない。それにこの程度しかやる事がないのだからしかたない。特殊な場合を考えると、不正ユーザーの排除なども行えるようにすべきかもしれないがそれはちょっと考えよう。

だが、肝心の応募者が未だにいないので放置に耐えるように改良する事や、なんとか集団で管理してもらう事も考えに入れておいた方がいいかも。


2005-01-12 [J]

_ [雑記]助っ人用ページの作成状況2

残るは、サイト情報の編集機能のみ。どうしても、既存の編集機能と併用しなければならないが、統合したりログインして編集モードを付加するといったことは面倒なのでこれでよしとしよう。

なんだかんだと機能が増えてしまった。助っ人募集の見本として後数回いじってから編集不可能な状態で公開してみようと思う。


2005-01-13 [J]

_ [雑記]助っ人用ページ完成

自分が使う分には非常に使いやすく、間違って大量のデータを消してしまうなど、あまり心配しないで済むなかなかのものが出来たと思う。後は地味に見た目や使いやすさを追求していくだけ。まぁ裏方なので後回しになるだろう。

_ [雑記]本のこととか

デザインとかCSSとは苦手分野は後回しにして、作業効率を上げるためにもオブジェクト指向の本でも何冊か読もう。どうでもいいことだが、「入門RSS」という本は薄いわりに値段は高く、内容はよく言えば実用的、悪く言えば即物的で得るものはほとんどなかった。あれなら1月のソフトウェアデザインのATOM特集の方が面白いかもしれない。まぁとにかくあの有名な神崎 正英さんが今度出す「セマンティック・ウェブのための RDF/OWL入門」は必ず読まねば。


2005-01-14 [J]

_ [記号変更]『ムームーの部屋』(攻略)

開始記号 最新ゲーム攻略は.*?「 → htm">

終了記号 」 → (完全|投稿)攻略[#on]

トップページから攻略の更新履歴のページ巡回先を変更。何日待っても、最新のゲーム攻略が変更されなかったため。


2005-01-16 [J]

_ [雑記]アクセス統計

アクセス統計1今月のアクセス統計
アクセス統計2今までのアクセス統計
アクセス統計32004/12のユーザーエージェント
アクセス統計4
POWER PHLOGGER 2.2.5の結果(15分以上置くと別なvisitorとして数える。RSSへのアクセスはカウントしていない。)

http://d.nog.jp/
でアクセス解析の結果が公開されていたのでつられてちょっとだけ公開してみる。アクセス数少ないんじゃないかと思っていたからこれくらいでいいんだとちょっとほっとしてみたりする。
POWER PHLOGGER(PPhloger)とWebalizerの数値があまりに違うがWebalizerが間違っているんじゃないかと思っている。最近同時(15分)接続数が50を越えることも出てきたのに、1ヶ月前と大差ないというのはありえない。後、生ログを見ると1/15は1763ホストから接続されている。ただ何故間違っているのか原因は不明。
特別なのが「MagpieRSS」。これなんと1サイトのみでの数値。2004/11はなんと、501559アクセスを叩き出した。対処してくれたらしいので、現在はそれほどでもないがそれでもすごい(半月で90808)。どうも、アクセスすると無条件で200を返しているので、設定が間違っているんじゃないかと思うがまだ許容範囲なのでそっとしておこう。


2005-01-17 [J]

_ [雑記]久しぶりのサイト登録

サイト登録してもらったので、既存データの登録もやってみた。で諸々作業していて気づいたが、この作業も助っ人用ページから出来るようにしないといけない。要するにErogameScapeのIDがあるサイトはそのIDを使うようにすることと、既存データ登録だ。(登録サイト名とErogameScapeでのサイト名が違うときはErogameScapeでのサイト名が優先されるが、果たしてそれでいいのだろうか?)


2005-01-18 [J]

_ [雑記]いま必要なこと

考えた。振ると音がするような気もする頭で考えてみたら、いま一番必要なことは取得漏れチェックの簡略化だった。いまはいちいちサイトに行ってみて確認している、全てのサイトにだ。それはちょっと非効率過ぎる。

ということで、巡回ページの更新日=取得日でないものを更新日順に並べ、登録記号のあるあたりを切り出し表示するようにしてみた。けれども、巡回ページが単に更新履歴でない場合、取得データがなくとも更新される。これは仕方ないとして、広告など定型的で複数サイトに適応できるものについてはその部分を削除したものを、コピーとして保存するようにした。これで数サイトチェック対象から外れたわけだ。

ゲームリストやRSSはこれで問題ないのだが、やはり数サイトはチェックしないとならない。この問題が解決されたなら、もう少し登録サイト数を増やしたいと思っている。


2005-01-20 [J]

_ [雑記]実はもっと必要なこと

チェック済みの更新日以前のデータを非表示にしてみたら、なんにも変わらないはずなのに楽になったような気がする。ということでこれ以上は無理そうなのでこれで終了。

では、本題。ErogameScapeのIDもAmazonのASINもHolysealのIDも全てローカルで汎用性がない。それで探してみたならばJANコード(バーコード)というのが良さそうだ。遅すぎる気もしたが、商業2サイトに攻撃紛いの電子万引き的情報の奪取を行いデータを蓄えようと思い立った。

同人やおまけゲームにはJANコードは付いていない。初回版、通常版のように商品が違うと違う番号が割り当てられる。など作品として扱う場合には不都合な場合もあるがそれでも多くの可能性があると思う。例えば、JANコードと自分達のローカルなIDとの対応表があれば他との対応表も容易に作る事が出来る。しかも、JANコードやASINを指定することでローカルIDに変換、サイト閲覧を可能にすれば、ブログのようなシステムからも容易にリンクされることになる。これは、自分がやろうとしている自動運営が可能なリンク集の遥か上を行く意味を持っているような気がする。(当然だが、世間様はそういうことを十分把握していらっしゃいます。)

_ [雑記]JANコードの入手先

「コンピュータソフトウェア倫理機構」「DependSpace」「Getchu.com」「VIEWS」「J-NODE」「各ブランドサイト」「雑誌」などがある。

ただ、当然ながらデータ転載不可とある。まぁそれをきちんと守るならデータは集まるはずもないのだが・・・。雑誌から書き写すのも駄目、サイトから取得するのも駄目、合法的なのは流通にでも関わるか箱の裏を見て書き写すかだけだろうか。許可を求めればいいのだが、そういう社会常識を持った人間ではない(自分は)。ということで、どこから情報を盗ってくるか、考えてみる。

最良なのは、「Getchu.com」だが、漏れが多いのでどこかと併用する必要がある。まず、何故最良なのか、それはIDのすり合わせをすでにしているからだ。ということで、まずは決定。では漏れはどうするか。「DependSpace」が最良だが、転載不可と書かれている。そこで、他を考えてみる。「VIEWS」は付属情報も多く、新作のみしか見る事が出来ないので不可。「各ブランドサイト」は載っていない場合が多く不可。「雑誌」はいちいち手入力するのが面倒なので不可。「コンピュータソフトウェア倫理機構」は登録日順でゲーム以外もあるので面倒なので不可。ということで「J-NODE」のWinソフトカレンダー「そふとん1号」が最有力。1995年からのデータがあり、「本データ流用に関して一切の責任を持ちません。」とのことなので流用を禁止しているわけではないらしいから。


2005-01-21 [J]

_ [雑記]JANコードのすり合わせ1

現在3000ほどのすり合わせが終了した。ここまではほぼ自動で出来るので楽だが・・・・残りが一体いくらあるのか、本当に手元にあるデータ1000程度しかないのか、ちょっと不安がある。まぁとにかくAmazonの「ECS 4.0」とかいうやつでASINに変換出来そうか試してから、残りを実行しよう。

当然のことだが、「erogmap」や「ErogameScape」から取得できれば簡単なのだが、それはそれ苦労してすり合わせただろうし、アソシエイトをやれば、こんな貧弱サイトでもサーバー代くらいはなんとかなるんじゃないかと楽観視しているので、なんとかしよう。

_ [雑記]Amazonって・・・

なにやらすごいらしい。個人的には「Getchu.com」の方がユーザーに対する貢献度は高いと思っているが、なにより「Amazon」は便利だ。「Getchu.com」の場合パートナーサイトになってもバナーからトップページに行き買った場合のみ紹介料が払われる。個別のページからのものは対象外だ。もうほんの少しシステムを考えた方がいいのではないだろうか・・。

さて、本題。「Amazon」から情報を引き出してみたら、あらすじなんかも提供されているから驚いた。まぁ、標準で表示させるつもりはさらさらないが・・・・セッションを使い表示、非表示を選択出来るようにしても良いほど情報が豊富だ。しかも、JAN(EAN)コードもきちんと取得できる。同人作品や商品としてではなく作品として分類する場合に困るので、ErogameScapeは必須なのだが、やり方によっては、少しくらい不都合を我慢すればすごいサイトが出来るような気がする。


2005-01-22 [J]

_ [雑記]JANコードのすり合わせ2

大概のタイトルについては少なくとも1つはJANコードが設定された。正しいかどうかは不明なのが気に掛かる。確かめる方法はないから(バーコードとしてならあるが)、どうしようもない。ASINに変換する際にタイトルなど商品情報を取得できるのでこれについてはいいのだが、他はもうお手上げだ。ということで、あと少し古いタイトルのJANコードの検証に時間を割いたら、最新タイトルのJAN/ASINコードの管理のみとしよう。今の所5000近くあるのだが、なんとなく少ない気がする。

_ [雑記]Amazonの「ECS 4.0」について

ドキュメントもあらかた見終わった、非常に多種類の情報が引き出せるのはいいのだが・・・・。本サイトがしようしているレンタルサーバーではPHPのDOM XML関数やXSLT関数が使用できない、したがって「xml_parse_into_struct」で配列に格納するのだが、使い勝手が非常に悪い。これなら正規表現で取り込んだほうがまだましかもしれないが、どちらにしても多くの情報があってもそれを上手く取り込む事は難しい。単純にXSLTを適応させれば表示に問題はないのだが(未対応ブラウザも多いが)、データを取り込むのが面倒だ。

http://webservices.amazon.co.jp/onca/xml?Service=AWSECommerceService&SubscriptionId=108EDC1TC9M54DVE4Q02&AssociateTag=erogersscheck-22&Version=2004-10-04&Operation=ItemSearch&ResponseGroup=ItemAttributes&SearchIndex=VideoGames&ItemPage=1&ContentType=text/xml&BrowseNode=927712&Sort=-release-date

これで、発売日順にリストアップされるためこれを定期的にチェックすればいいはずだが、果たしてその必要があるかちょっと疑問だ。なにより、種類が少なすぎてデータベースにならない。何を基準に販売タイトルを決めているのか知らないが、これだけをチェックするのはあまりといえばあまりだ。ということはJANコードの方をチェックしてそれでASINを検索するということになる。

表示にしても外部データを取得するわけだから遅い。なので今表示している、あらすじ、画像の他はいらないかもしれない。少なくとも標準で表示させることになんの利点も見つけられない。

※「&page=」の部分は「&ItemPage=」が正しいようなので修正した。ITmediaでも目立つところでは間違っている・・・なぜ?

※「&SearchIndex=VideoGames」の部分は「Software」でもやる必要がある。


2005-01-24 [J]

_ [記号変更]『NE研』『oggbeeの戯れ言?』『ドクター迦楼羅のPCゲームクリニック』

『NE研』

開始記号 .{8}「[#on] → .{12}「[#on]

終了記号 」(攻略|を追加)[#on] → 」

終了記号に」と攻略の間に(が入っていたため上手く取れなかった。暫定変更。

『oggbeeの戯れ言?』

巡回スクリプトのバグにより変更、戻すまでもないのでそのまま。

これらは数日前のこと。

『ドクター迦楼羅のPCゲームクリニック』

開始記号 2004年のレビューに「 → 2005年のレビューに「

年度変更による。今頃気づいて変更のこと。


2005-01-25 [J]

_ [雑記] 「Last-Modified」のせい?

どうも、時々更新チェックから漏れる時がある。今までで10回はあっただろうか、エラーが出るわけでもなく未更新と判断されてしまう。「Last-Modified」がおかしい値を返すのかと言えばそういうわけでもない。今回は何時更新されたのか定かではないが、4回程度の更新チェックをすり抜けたと思われる。どこかにバグが潜んでいるような気もするのだが・・・・検討もつかない。

_ [雑記] Amazon諸々

知らなかったのだが、Amazonへのリンクに「ref=nosim」が含まれていないと個別商品へのリンクに対するプラス2%の紹介料の上乗せがされないらしい。まぁ、今の所、良く分からないがリンクされていない商品を1つ買ってくれた人がいるだけなので、このまま紹介料とは無縁の世界に住むことになると思うけれど。

_ [雑記] ASIN/JANのリンク先

blogmapやはてなにリンクしてみたが、廻ってみても有用な情報が少なすぎる。いちいちリンクして紹介・・が減るのもなんだという考えもあるにはあるが、それを差し引いてもほとんどAmazonから引き出せる情報のみで意味がない。だからといってGoogleにしても広告ばかりであまり意味がない、そこで迷っているわけだ。あの目立つ位置に書いていることも無駄に思える。JANについては自分にとってはGoogleへのリンクは非常に有用だ。正しいかどうかがなんとなく判断できるからだ。あらすじ、画像表示の仕方も合わせて有用なレイアウトを考える必要があるようだ。

ということでやってみた。XSLTについての知識はほとんどないのだが、見よう見まねでやってみると・・・結構簡単に情報を取得できるのでちょっとびっくり。情報のあるなしや、複数ある場合にちょっと表示が乱れるかも知れないが、これで一応欲しかったデータを全て表示できた。ASINへのリンクの問題も解決した。ただ分かりにくいかな?

_ [記号変更] 『萌えラボ』

『萌えラボ』

開始記号 レビューに「 → レビューに(?:「|「)[#on]

終了記号 」 → (?:」|」)[#on]

「」の両方が半角になっていたので対応。前にも他のサイトであったのだが、半角の「」は一体どうやって入力するのだろうか。


2005-01-27 [J]

_ [記号変更]『ムームーの部屋』(攻略)

終了記号 (完全|投稿)攻略[#on] → (完全|投稿|)攻略[#on]

攻略の前に完全も投稿も付いていなかったので、その場合にも対応。

_ [雑記] スクリプトをオブジェクト指向に書き換えない

色々考えたのだが、今特に不便もないのだから書き換える必要もないのかもしれない。公開する時のために書き換えようとは思ったが、新しく書き直す方が楽なようなので、その時にでも試してみよう。なんにしても、少しずつだが技能が向上しているらしく、数ヶ月前に書いたスクリプトは無駄が多くて見るに耐えない。

それにオブジェクト指向が本格的に採用されているPHP5.0以上が使える環境でもないのだからそれからでも遅くない。何よりオリジナル関数もほとんど作っていないのだから、まぁ段々と。

_ [雑記] セマンティック・ウェブの本

機械に理解できるウェブの事を、セマンティック・ウェブというらしい。この本は見た目はかなり質素だがその分値段も安く、内容は充実していると思う。入門というより解説書や規格書の趣が強いようだ。まだ半分も読んでないけど。

_ [雑記] RSSの是非2

さて、唐突だがネットが普及し始めた90年代のネットが好きだ。今よりもずっと使いにくく有用な情報など一握りだった。それでもとても好きだった。なので必然的にRSSを初めとしたセマンティック・ウェブは好きではない。混沌としているからこそ面白いのに整理されては、もう「おもちゃ」ではなく「道具」になってしまう。

以上が個人的な見解だが、リンク集の管理人として、その他どんな立場に立ってもそれは必須だろう。ただ、既に書いたようにあくまで技術面での話で個人が無理をして対応すべきではない。現状では、もし仮にXMLでサイト全体を記述したとしてもあまり利点はない。XSLTに未対応のブラウザもまだ現役だ。RSSを別途自分で記述するのも大いなる無駄だ。情報を機械に分からせるよりも自分の時間の方がずっと重要だ。

ただ、1つ言えるのは、手書きでもしくはホームページメーカーのようなタグが見える形でサイトを作るのはそろそろ、やめるべき時代が来たのだと思う。基盤技術はいつも隠すべきだ。それをいじらせるということは、表現に大きな幅が生まれるということだ。それを理解することは、機械にとって困難だ。しかし、その上の表面のみをいじらせるなら、機械はその奥を理解する事が出来る。

HTMLはそう言ったことに非常に不得手、というより欠陥があった。現状、CSSを表示関係、HTMLを論理関係、と分けたがっているがきっちりとしていない、要するに互換性を持ち以前の思い通りに表示できたらそれで良い書き方が可能な、緩い規格なのだ。

ブログはそれでも扱いやすい方法で論理性を持たせていると思う。ヘッダ、フッダ、記事、見出しそれぞれを分けている。それをあと少し時間を掛けながらセマンティック・ウェブに近づいていくのだろう。

結論としては、システムが出来上がる手助けをして欲しい、要するにそんな技術を出来るだけ使って欲しい、そうすれば普及する日も遠くないだろう。(えらそうに書いている自分はと言えば、面白そうだから、楽が出来そうだからやっているだけで、上のは机上の空論に過ぎない。)


2005-01-28 [J]

_ [雑記] 助っ人不在

このままだと本当に助っ人不在の完全放置状態で1ヶ月ほどサイトを置いていかないとならないらしい。正規表現が分かる事を条件に挙げているのが悪いのだろうか?

それはともかく、放置した場合の状況を想定してみよう。1ヶ月後には・・・最悪だと、取得ミス10以上、取得漏れ5サイト前後、非整形データ取得30以上。といったところで、順当に行けば、先月、今月を参考にして考えると、取得ミス、漏れ、非整形合わせて20くらいだと思う。ただ、移転や閉鎖が1、2あるかもしれない。

まぁ、動かないわけではないが3日に1回はゴミが出るだろう・・。誰かチェックしてくれる人はいないだろうか?


2005-01-31 [J]

_ [雑記] あれとかこれとか

あれ?何故か、あちこちで特定の未発売タイトルのIDが確定されてしまっている。直したが、比較対象元が空欄の時に起こるのかと思っていたが、何故か確定済みのものまで、おかしくなっていた。ありえないはずなのだが、はて?

これ、からの予定は今の所ない。エラー報告も要望もないので裏方で気づいたときにチェックするだけ。後は、機能の縮小、合併をやってみるくらい。長期放置の後の惨状を出来るだけ少なく出来るように安定性重視で細々とやってみよう。