データのインポートとエクスポートとは? ~エクスポートファイルは相手に合わせよう~|データ分析用語を解説

  • f
  • t
  • p
  • h
  • l
eyecatch_words

本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)

最適なエクスポートファイルとはインポート先のシステムを意識したファイル

ITに詳しくなくとも「インポート(import)」と「エクスポート(export)」と言う言葉は知っていて、普段の業務の中でこれらの操作を行っている方も多いと思います。この「インポート」と「エクスポート」との関係は非常に密接であり、どちらか片方だけでは役目を果たさない事が多いです。

インポートとエクスポートとは

インポートとエクスポートについて、IT用語辞典の内容を引用しました。

【インポート(impoert)】引用:IT用語辞典|インポートとは
あるソフトウェアが、他のソフトウェアで作成されたデータを取り込んで利用できるようにすることをインポートという。
【エクスポート(export)】引用:IT用語辞典|エクスポートとは
エクスポートとは、他のアプリケーションソフトが解釈できる形式でファイルを保存する機能。

この様にインポートもエクスポートの他のシステム、またはソフトとのデータ連携として、データファイルの入出力を行う操作です。そのため、エクスポートされたデータファイルには、それを取込むインポート先のシステムがあり、逆にインポートするデータファイルには、それを作ったエクスポート元のシステムがあります。この2つがセットになってインポート/エクスポートの一連の流れができるのです。

インポートの事を考えたエクスポートとは

インポート/エクスポートの一連の流れのスタート地点は、エクスポート元のシステムからのデータファイルのエクスポートなります。このデータファイルの形式が、インポート先のシステムで取り扱えない形式だった場合、せっかくエクスポートしたデータファイルが無駄になってしまいます。
エクスポートする場合は、インポート先のシステムを考え、取り扱いやすいデータファイル形式にする必要があります。特にデータファイル形式で決めなくてはいけない事項は下記の内容になります。

  • データファイル形式:区切り文字ファイル(CSV、TSV)固定長データファイル、XMLファイル、JSONファイル など
  • 文字コード:UTF-8、Shift-JIS(MS932)、Unicode など
  • 区切り文字:カンマ文字、タブ文字 など
  • データ項目の括り文字:ダブルクォーテーション、シングルクォーテーション など
  • 日時の書式:YYYYMMDD、YYYY/MM/DD HH:MM:SS など
  • 数字の書式:カンマ有無、符号有無 など
  • ファイルサイズの上限 *1:ファイル容量、行数 など
  • その他:タイトル行の有無、改行コード、禁止文字 など

(*1) 上限を超える場合はファイル分割

データ分析用語:索引
  • f
  • t
  • p
  • h
  • l