データベースの表(テーブル)とは?:DBMSが管理している情報の”肝”|データ分析用語を解説
f t p h l
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
データベースの主役「表」
本日はデータベースにおける「表」という言葉を解説します。表は英語ではテーブル(Table)と訳される、データベースの主役ともいえる存在です。
まず、前回のおさらいから
以前の記事で「データベースとは何か?」について解説させていただきました。ここで「データベースとは”ある規則で並べられたデータの集まり”」と説明しました。また「データベースマネージメントシステム(DBMS)とは何か?」では「DBMSとは”データを管理することに”主眼をおいたソフトウェアである」と説明しました。この「DBMSが管理する物」の中で最も重要な管理対象が。この「表」なのです。
表(テーブル)とは?
まず、以下に表の代表例を記述いたしましたのでごらんください。初代内閣総理大臣の伊藤博文さんから第三代山縣有朋さんまでのデータが格納されています。
表の名前:総理大臣テーブル
氏名 | ふりがな | 出生日 | 出生地 | 出身校 | 死没日 | 死没地 |
伊藤博文 | いとうひろぶみ | 1841年10月16日 | 周防国熊毛郡 | 松下村塾 | 1909年10月26日 | 中国黒龍江省 |
黒田清隆 | くろだきよたか | 1840年11月9日 | 薩摩国鹿児島郡 | 1900年8月23日 | 東京府 | |
山縣有朋 | やまがたありとも | 1838年6月14日 | 長門国阿武郡 | 松下村塾 | 1922年2月1日 | 神奈川県小田原市 |
上述したデータベースについての説明どおり「規則」があります。以下の規則を満たすものが「表」と言えるでしょう。
データの並べ方に関する規則
各データを垂直と水平に区切って並べることによってデータを表しています。垂直の区切りを「列」、水平の区切りを「行」と呼びます。行と列にはそれぞれ「決まったルール」でデータを入れなければなりません。この場合、列に関するルールは「一列目には漢字の名前を入れる」「二列目にはひらがなの名前を入れる」「三列目…」です。行に関するルールは「一つの行には同じ人のデータを入れる」です。
データ数の増減に関する規則
表を作った段階(定義された段階)で列の数は固定されます。 行の数は固定されません。上記の例だと列を追加する場合は表を作り直さなければなりません(再定義)。これに対して行のデータには第四代・第五代の総理大臣のデータを追加していく事ができます。
列には名前があり行には番号がある
上記の場合、列には「一列目:”氏名”」「二列目:”ふりがな”」「三列目…」という名前が与えられます。行には「1番目の総理大臣」「2番目の総理大臣」「3番目…」という番号が与えられます。(列の名前に関しては厳密なルールではありませんが、表を理解するうえではとても重要な考え方です。)ちなみに上記表の緑の部分は項目名が記述されている特別な行です。この行を「ヘッダー」と呼び、普通のデータとは別個に管理されます。(極端に言うと「総理大臣テーブルのデータ」の範疇に含めません。)
データ分析用語:索引
f t p h l