西国立志編


底本:架蔵本 明治4年 同人社蔵版


電子化の方針

  1. 旧漢字バージョン:現在(2015年)において、ブラウザ上でなるべく本文に近い漢字が表示できるようにする。……原典重視の方針
  2. 新漢字バージョン:ブラウザ上でのルビ表示を残しつつ、電子的な検索を優先する。……検索重視の方針

    旧漢字・新漢字に変換する時には、山紫水明(2004.1.5)作の秀丸のマクロ「ListReplace.mac」を使っている。利用した変換テーブルは、ここ に載せておく。


凡例

  1. 文字コードはUTF-8とする。
  2. 本文と同じく、漢字カタカナ交じりとする(旧漢字バージョンで新漢字になっている字は底本がそうであることを示している)。
  3. 本文の〔  〕は同じ〔  〕で表示。
  4. 本文の割り注は【  】で囲んで表示。
  5. 右ルビはrubyタグを使って漢字の上に表示する(インターネット・エクスプローラーでのみ表示可能)。
  6. 左ルビは「㊧」と表示して、右ルビと同様に漢字の上に表示する。
  7. ルビが漢語の一部に付いていると判断した場合(漢字にルビがかかっていない場合)は、付いていない漢字を1字につき■■で補った(□□では、ブラウザ上で漢字の口やカタカナのロと紛らわしいため)。
     こうしたことは四字熟語によく見られる。類義の二字熟語を並べたものは積極的に四字熟語と認めた。
     例:開化文明トナルコトナリ、放ツトコロノ回光返照ナリ
     ・なお、2つの熟語に格関係が認められる場合は二字熟語とした。 例:ソノ政事優美なりとも、人ノ性行壊悪ナルナリ
  8. カタカナの内「子」「井」様異体字は「ネ」「ヰ」とした。
  9. 個人名で小さな「」で名と姓を区切っている本文は、小さな「」を「・」(中黒)とし、右ルビは「・」相当のところを空白とした。 例:維廉・大互ヴイルレム ダーガン
  10. 本文やルビにおいて「-」で字を結合させている場合は「-」(半角)とした。
  11. ページ情報:旧漢字バージョンでは、本文の検索を容易にするため、ページを\\02u(2丁裏の意味)のように付けた。
    新漢字バージョンは、電子的な検索のために、ページ区切り符号を付けていない。
  12. 傍線本文のカタカナと紛れる場合に限って付けた。したがって、本文に傍線が無くても付けた箇所がある。htmlでは<u></u>で囲んである。原文では、原語のカタカナ表記が右一本線・人名が左一本線・地名が左二本線であるが、その区別はしていない。
  13. 傍点(ヽ)、圏点(o):付けない。
  14. 合字:読みかえる。 →ドモ →トモ(ただし、文脈によりドモと翻刻した箇所も多い) →トキ/ただし、はUTF-8にあるので「ヿ」と翻刻した。
  15. 繰り返し符号:「ヽ」「ヾ」はそのまま。長い「く」の字状のものと「ヽ」を2回繰り返したもの →どちらも「々」とする。
  16. 濁点:検索の便を考えて、何カ所か、濁点を補ったり、濁点を削除したりしているので、引用の際には、本文を確認のこと。
  17. 右下付きの送りがな:本文よりもフォントを落として表示する。htmlでは<sub></sub>で囲む。
  18. 章の数字:章の数字は○で囲まれているが、再現できないので、統一して○を付けない。そして、数字の後、1字分空ける。
  19. 漢字:リッチテキスト形式でも処理できない字や、リッチテキスト形式では可能だが、UTF-8で処理できない異体字(どちらも『今昔文字鏡』で判断)は、それぞれ旧漢字・新漢字にしてある。
    具体例
    本文
    画像
    ritch text
    文字鏡番号
    旧漢
    字版
    新漢
    字版
    新旧の字体に差がある例
    リッチテキスト
    不可能

    090136

    036568

    009132
    新旧の字体に差がない例

    042086

    072431

    017448

    202510

    025175
    リッチテキスト
    不可能

    050918
    リッチテキスト
    不可能
    欠画 その他
    欠画でない場合もある。
    巻1,19丁表2行目。

なお、本文は国会図書館 近代デジタルライブラリー等で画像資料として見ることができます。


文字鏡研究会サイト(http://www.mojikyo.org/