西国立志編


底本:架蔵本 明治4年 同人社蔵版


電子化の方針

  1. 旧漢字バージョン:現在(2006/07)において、ブラウザ上でなるべく本文に近い漢字が表示できるようにする。……原典重視の方針
  2. 新漢字バージョン:ブラウザ上でのルビ表示を残しつつ、電子的な検索を優先する。……検索重視の方針

    旧漢字・新漢字に変換する時には、山紫水明(2004.1.5)作の秀丸のマクロ「ListReplace.mac」を使っている。利用した変換テーブルは、ここ に載せておく。


凡例

  1. 文字コードはUTF-8とする。
  2. 本文と同じく、漢字カタカナ交じりとする(旧漢字バージョンで新漢字になっている字は底本がそうであることを示している)。
  3. 本文の〔  〕は同じ〔  〕で表示。
  4. 本文の割り注は【  】で囲んで表示。
  5. 右ルビはrubyタグを使って漢字の上に表示する(インターネット・エクスプローラーでのみ表示可能)。
  6. 左ルビは「㊧」と表示して、右ルビと同様に漢字の上に表示する。
  7. ルビが漢語の一部に付いていると判断した場合(漢字にルビがかかっていない場合)は、付いていない漢字を1字につき■■で補った(□□では、ブラウザ上で漢字の口やカタカナのロと紛らわしいため)。
     こうしたことは四字熟語によく見られる。2つの熟語を並べたものは積極的に四字熟語と認めた。
     例:開化文明トナルコトナリ、放ツトコロノ回光返照ナリ
     二字熟語とした例:ソノ政事優美なりとも、人ノ性行壊悪ナルナリ
  8. 本文やルビで、1字分のスペースがある場合は、■とした。
  9. カタカナの「子」「井」は「ネ」「ヰ」とした。

    改変してある本文情報
  1. ページ情報:旧漢字バージョンでは、本文の検索を容易にするため、ページを\\02u(2丁裏の意味)のように付けた。
    新漢字バージョンは、電子的な検索のために、ページ区切り符号を付けていない。
  2. 傍線本文のカタカナと紛れる場合に限って付けた。したがって、本文に傍線が無くても付けた箇所がある。htmlでは<u></u>で囲んである。原文では、原語のカタカナ表記が右一本線・人名が左一本線・地名が左二本線であるが、その区別はしていない。
  3. 傍点(ヽ)、圏点(o):付けない。
  4. 合字:(新漢字バージョン)読みかえる。→コト →ドモ →トモ →トキ:(旧漢字バージョン)。→ヿ →ド*モ →ト*モ →ト*キ *は半角米印
  5. 繰り返し符号:「ヽ」「ヾ」はそのまま。長い「く」の字状のものと「ヽ」を2回繰り返したもの →すべて「々」とする。
  6. 人名の名と姓を区切る小さい中丸「」は中黒「・」とする。それに対応するルビでは、全角1字分の空白を置いた。
  7. 章の数字:章の数字は○で囲まれているが、統一して○を付けない。そして、数字の後は全角1字の空白を置いた。
  8. 濁点:検索の便を考えて、何カ所か、濁点を補ったり、濁点を削除したりしているので、引用の際には、本文を確認をしてください。
  9. 右下付きの送りがな:本文よりもフォントを落として表示する。htmlでは<sub></sub>で囲む。
  10. 漢字:リッチテキスト形式でも処理できない字や、リッチテキスト形式では可能だが、UTF-8で処理できない異体字(どちらも『今昔文字鏡』で判断)は、それぞれ旧漢字・新漢字にしてある。
    具体例
    本文
    画像
    ritch text
    文字鏡番号
    旧漢
    字版
    新漢
    字版
    新旧の字体に差がある例
    リッチテキスト
    不可能

    090136

    036568

    009132
    新旧の字体に差がない例

    042086

    072431

    017448

    202510

    025175
    リッチテキスト
    不可能

    050918
    リッチテキスト
    不可能
    欠字 その他


なお、本文は国会図書館 近代デジタルライブラリー等で画像資料として見ることができます。