README for ancient fj NetNews archive

1. これは何か?

Netnews の世界の fj ニュースグループ群の記事を、 ニュースグループごとにアーカイブとしてまとめたものです。 GalaxyやASKSといったWeb上のサービスから記事を取り出しました。 1980年代末から1990年代末ぐらいまでの古いものが中心です。 GalaxyやASKSに残っていた記事は流通分を網羅はしておらず、かなりの抜けがありました。 このアーカイブでは、ニュースグループによっては、 さらにそれの7割程度の記事しか捕捉保存できていない場合もあります。

1.1 ファイルの形式

ニュースグループ毎に記事群を1つのアーカイブファイルにまとめてあります。 まとめたアーカイブファイルの名称は、おそらくニュースグループに対応したファイル名になっているはずです。 例えばfj.unixというニュースグループであれば、 fj.unix.tgz のような名称になっているでしょう。 あるいはtgzの部分は他のアーカイバの拡張子になっているかもしれません。

アーカイブ内では1つの記事が1つのファイルになっています。 このファイル名は1番から始まる番号で、これはDate:フィールドの古い順になっています。

1.2 原本との非同一性

このアーカイブは、NetNewsとして流通していた記事をそのまま保存したものではありません。 GalaxyやASKSでは、サービス内容にあわせ、記事に多少変換を施して提供していました。 このアーカイブでは、それを元になるべく原本に近い形に記事を復元再構成しました。 しかし、以下のような理由により、実際に流通したものと異なっている場合があります:

Galaxy netnews archive から取得した記事の場合:
tabの4 spaceへの展開、複数行に渡るフィールドの変換、文字コードの変換上の制限など。
ASKS netnews archive から取得した記事の場合:
1行目の欠落、行先頭の空白の特殊扱い、不正なLines:フィールド、MIME encodeとSubject:フィールドの不整合、複数行に渡るフィールドの削減、文字コードの変換上の制限など。

色々な情報を摺り合わせて可能な限り再構成しようと試みましたが、 一部文字化けのようなものが残ったり、復元が不可能だった部分もあります。

1.3 ヘッダー部に追加したフィールド

記事の再構成に関係する情報をヘッダーに追加してあります。 追加したフィールドは以下の通りです。

X-originally-archived-at:
記事をどこから取得したかをURLで表します。 ここに記述されているURLは既に廃れたもので、現在は参照できません。
X-reformat-date:
記事の再構成を行なった日付で、バージョンの意味を併せ持ちます。 実用的なアーカイブは18 Nov, 2003以降のもので、 それ以前のものは再構成に大きく失敗しています。
X-reformat-comment:
原本と相違がある旨の注意書きで、違いの要約をしてあります。
X-reformat-error:
何らかの理由で再構成がうまくいかなかった記事についてのみ追加したフィールドで、 失敗の内容を示します。 現在のところ、以下のような失敗を確認しています。
X-reformat-error: Irregular or illegal code in the original archived article. (後略)
文字コードのiso-2022-jpへの変換に失敗したものにこのフィールドが付いています。
X-reformat-error: Illegal Date field.
Date: フィールドの形式が規格外のものにこのフィールドがついています。
これ以外の問題を発見した方は、ぜひご連絡ください。

2. 権利義務と配布条件

2.1 本アーカイブの由来と公開の妥当性

本アーカイブは、

で公開されていた fj の記事を保存したものです。

(注) 呼称こそ違いますが、 GalaxyとASKSは互いに親密な研究グループが運営し、 サービス内容はほぼ同じです。

どちらも既にサービスを終了しており、現在はこれらを参照することはできません。 記事の取得は、2001年の春から夏にかけて行いました。

本アーカイブは、GalaxyやASKSを運営していた、 新情報処理開発機構(RWCP)情報ベース機能つくば研究室 (Galaxy Clustering 開発グループとASKS開発グループ) には特にお断りなく公開しています。 RWCPは2002年3月末に役割を終えて解散しており、 RWCP宛てのメールでは関係者に連絡がつきませんでした。 GalaxyやASKSで提供されていた記事群は、 fj.1st-readmeの記事 Copyright Guide around fj (1/1) もしくは類似の考え方に準拠して配布されているものと判断しました。 その上で、このアーカイブも同じ考え方に則って公開をしています。

2.2 このアーカイブの再配布

2.2.1 アーカイブ全体やニュースグループ単位での再配布

一定の条件に従えば、このアーカイブをさらに再配布することは可能です。 例えば、 fj.1st-readmeの記事 Copyright Guide around fj (1/1) を参照してください。 しかし、この記事にも述べられている通り、

のであれば、再配布・公開してよいものと思われます。

2.2.2 記事の単独での再配布

記事群をnewsgroup単位で扱うのはなく、個々の記事を単独で公開や再配布することは危険をはらみます。 実際過去にトラブルも発生しています。 ただし単独配布の可否には揺れがあり、 一部の記事を選択して議論の対象にする自由もあるはずだという主張もあります。

本アーカイブ内の個々の記事は、私のものでも RWCP 情報ベース機能つくば研究室のものでもなく、 元の投稿者の方々のものです。 記事単独での公開に関しては、私が規定や判断基準を定めることはできません。 私に対して再配布や複写の許諾を求められても、返答できない可能性があります。 ただし、引用に関しては、 著作権法に沿った正当な引用 であれば、自由に行なってよいでしょう。

直接再配布することなしに、広く他人に記事を見てもらう安全な方法もあります。 Message-ID による記事の取り出しサービスを利用して、 記事のURLだけを伝えるという方法です。 公の場での発表など、厳しい規範が求められたり、余計な議論が起きるのを避けたい状況では、このサービスの利用が有効かもしれません。

(NetNewsの記事ではなく)この文書自身については、いかなる形式にでも自由に利用して下さい。

3. 関連する情報やサービス

3.1 このアーカイブに関する情報のページ

より詳しいことや最新情報、 他のニュースグループのアーカイブ、 個々の記事をWebで参照するサービス などに興味がある場合は、 Ancient fj news archive を参照してください。

3.2 参考文献

Galaxyのサービスが公開されたという記事:

From: hironobu@trc.rwcp.or.jp (Hironobu Takahashi)
Newsgroups: fj.comp.text,fj.comp.ai,fj.ai,fj.news.group
Subject: Text retrieval system for internet news (FJ Category)
Date: 22 Sep 1999 05:47:03 GMT
Message-ID: <7s9qgn$qh3@news.trc.rwcp.or.jp>

を、下記のURLが示すページで閲覧することができます。

4. 謝辞

fjで有用な議論をしてくださった投稿者の方々に感謝いたします。 fjの黎明時からの古い記事を保管していて広く公開して下さった 新情報処理開発機構(RWCP)情報ベース機能つくば研究室に感謝いたします。 RWCPの存在当時、高橋裕信さんには何度か質問にお答えいただきました。

このアーカイブの配布元として、 Ring Server Projectの ソフトウェアライブラリのお世話になっています。


編集者:渡邊克宏 <katsu@watanabe.name>

最新アーカイブ編集日時: Mon, 18 Oct 2004 15:18:22 +0900

この文書README.htmlのバージョン: $Id: README.html,v 1.8 2004/02/20 07:46:04 katsu Exp $