FireBird DBMS を使う
[ Prev 0. はじめに ] [ Top 目次 ] [ Next 2. データベースを作る ]

1. 使用したデータ

1.1. 謝辞

有益なデータを公開されましたチャールズ・シブリー博士と世界鳥類名勉強会の皆様に感謝します。

1.2. 何を作ってみましょう?

適度に多いデータ量があって、何か役にたつもの。

そこで、「世界の鳥類リスト」に着目しました。

趣味で野鳥の観察を行っていると、鳥の名前の和名、学名、英名の対照表や分類表が欲しくなることがよくあるからです。
自然科学、わけても生物科学の分野は、DNA分析の手法が取り入れられ、従来の形状的分類から大きく様変わりしています。
昔、中学高校の理科の授業で習ったことなど、全然変わっています。

1.3. 鳥類分類とは

1.3.1. 分類体系

最初にお断りしておきます。

私はプログラマではありますが、野鳥の研究者ではありません。
生物学に関しては野鳥を見るのが趣味なだけの一介のアマチュアです。

自然科学の他の分野と同様、鳥類の分類は新しい研究によって日々変化し続け、確定したものはありません。
市販の図鑑などは、いまだに「古典的分類」と呼ばれる形状的分類を採用しているものも多くあります。

そこで、1995年に 故チャールズ・シブリー博士 が発表された 「シブリー・アールキスト鳥類分類第2版」を使うことにしました。
この分類体系は形態的古典分類から決別した新世代分類のマイルストーンであり、現在もっとも影響力の大きなもので、Wikipedia 等でも主流になっています。

シブリー博士はご自身の研究成果のリストを、
「野鳥は誰の独占的所有物でもなく研究成果は人類共有の知的資産である」
という考えのもとに、フリーで公開なさいました。

時折しもリチャード・ストールマンのフリーソフトウェア運動、リーナス・トーバルズによる Linux の誕生、1990年代、自然科学の分野でも同じようなムーブメントが起きていたのです。

1.3.2. 参照したデータ

これに「世界鳥類リスト勉強会」が和名を付けたものが 「明石のはらくらぶ」 の WEB ページから手に入ります。

シブリー博士に感謝しつつ、今回はこれを元にしてみました。

1.4. データについて

1.4.1. 作ったデータ

生物学上の分類では、上位から

となります。

鳥類は鳥綱(Aves)に属しますので、分類が必要になるのは目以下になります。

もっと細かな分類もありますが、今回は一般の図鑑等と同じように「目-科-属-種」の分類としました。

日本鳥類リスト勉強会の和訳リストには、種の学名、英名、和名しか入っていません。
これに、属名、科名、目名を付け加えるために、Wikipedia等の情報を参考にしながら、暇を見ては書き加えていきました。
しかし、目と科の和名は分かるのですが、属名の和名の情報は確定したものがありません。
やむを得ず、今回のデータでは、属の和名は殆ど空白になっています。

取り敢えず何とか作り上げたデータは以下のようなものです。

カンマ区切りで、        文字セット  最大文字数
フィールド 0 : 種の学名 ISO8859_1      36
フィールド 1 : 種の英名 ISO8859_1      36
フィールド 2 : 種の和名 JIS X 0208     17
フィールド 3 : 属の学名 ISO8859_1      18
フィールド 4 : 属の和名 JIS X 0208     
フィールド 5 : 科の学名 ISO8859_1      17
フィールド 6 : 科の和名 JIS X 0208     15
フィールド 7 : 目の学名 ISO8859_1      16
フィールド 8 : 目の和名 JIS X 0208      8
23目
146科
2,060属
9,946種 あります。
文字コードは EUC-JP

1.4.2. データのダウンロード

シブリー博士の精神を継承し、このリストももちろんフリーです。

Copyright(c)2009 oosato
このデータはフリーソフトウェア財団が発行した GNU フリー文書利用許諾契約書 バージョン1.2またはそれ以降のライセンスの下に、自由に再利用・再配布できます。

9,946行 ありますので、ブラウザ環境によっては画面表示場合に少し時間がかかります。

でも、このデータは、大きいとは言っても、たかが 1MBです。

もし、あなたのブラウザで表示が遅いとしても、それはネットワークやサーバーのせいではありません。画面表示させずにダウンロードした場合は一瞬だと思います。
どうやら、最新の一部のブラウザのレンダリングエンジンにプレーンテキストの解析が極度に遅いものがあるようなのですね。

また、Microsoft Internet Explorer には、text/plain を正しく扱えない重大な規約違反があります。たぶん表示されるとは思いますが保証はできません。

場当たりな対処方法は知っていますが、あえてやりません。このサイトだけ対処したところで意味がないからです。
お勧めする唯一の解決策は、Microsoft Internet Explorer を使わないこです。
Internet Explorer のこのバグは、技術的な未熟さではなく、商業的覇権のための意図的な標準無視の行為と思われるので、対処はしません。

単純な原則的なポリシーです。いくら良く売れると言っても、残留農薬が基準値を超えた野菜は、売らない買わない食べない、即時廃棄するのと同じ程度の常識的な原則です。

この続きは最終章で 7. HTML と標準

[ Prev 0. はじめに ] [ Top 目次 ] [ Next 2. データベースを作る ]
written by © 2009,OOSATO,Kazzrou : kazz_atmark_kk.iij4u.or.jp

この HTML を検査する。 ( XHTML 1.0 Strict で書かれています )
Another HTML Lint Gateway ( Mirrored by htmllint.oosato.org )