仕事でパワークエリーを使ってデータをマージする機会があったので使用感などを備忘用に記録してます。
作業の流れとしては
1・Excelからパワークエリーを立ち上げる(Excelとは別のソフトという感じ)
2・対象データをパワークエリーのテーブル形式に変換する
3・テーブル間の共通項目を関連付ける(DBで言うリレーションシップ作成)
4・ファイルレイアウトを決める(Accessで言う、まさにクエリー作成)
5・Excelのデータとして出力する(Excelへのエクスポート作業)
という感じ
元データがカンマ区切りのCSV形式だったのですが、テーブルに読み込む場合ではCSVをExcelで読み込む際に問題となる、ゼロとび等は発生しなかった。(Calcと同じように、読み込むときにデータ型を指定できるので意識しやすいと思う)
パワークエリーでは、テーブルやクエリーといったDBにも出てくるオブジェクトが出てきますが、そのオブジェクトについて、データベース(AccessやBASEなどのDB)の操作に慣れている人は戸惑うのではないかと思いました。
共通項目(リレーション項目)を選ぶ動作であったり、内部結合や外部結合なども指定できるので、結果に不満は出ませんが、何か釈然としないなぁと思ってしばらく操作していて理由がハッキリしました。
リレーションや結合方法等の指定がデータベースでは画面のGUI操作で操作できるのに、パワークエリーではデータベースのように操作ができないところに引っかかっていたようなのです。
パワークエリーでは画面の上下でテーブルを選んで、連結する共通項目を指定し、出力する項目を指定して出力という作業自体はDBのクエリーとほぼ同じである点も操作性に違和感を持ってしまうのかもしれません。
Ms-Office以外のツール利用が認められるのであれば、OSS(オープンソースソフト)の利用も候補にしてみてはいかがでしょうか?
個人的には、パワークエリーでやりたいことはPentahoやApacheHOP などのETLツールの方が操作手順は分かりやすいと思います、テーブルに取り込む作業も要りませんし、バッチファイルに組み込む事もできますしね
posted by LibreOffice Users Group at 20:27
|
Comment(0)
|
TrackBack(0)
|
コラム
|
|