Creazy!

WEBエンジニア・ヤガーのテック・ガジェットブログ

PostgreSQL 小技集

PostgreSQLでCSVやTSV用に改行コードを取り除く方法

投稿日:


DBからCSV(カンマ区切り)やTSV(タブ区切り)でデータを出力するってことがたまにあるのですが、出力するデータに改行が入っているとCSVやTSVのフォーマットが崩れてしまってエクセルなどでうまく開けない時ってありますよね。
そんな時に幸せになれるかもしれない方法(PostgreSQL限定)を書いてみます。

素直に改行コードをreplaceで変換する

一つ目の方法は、まあ、単純に思いつきそうですが、replace関数で変換してしまう方法です。
変換対象の改行コードは以下のように表すことができます。

  • chr(13) : CR(キャリッジリターン)
  • chr(10) : LF(ラインフィード)
  • chr(13)||chr(10) : CRLF

これをSQLで書いてみると、

select replace(replace(replace(description,chr(13)||chr(10),' '),chr(13),' '),chr(10),' ')
from hogetable;

replaceをネストして上記3種類の改行コードを変換するんですね。

正規表現を使って改行コードを変換する

PostgreSQLには「regexp_replace」という正規表現で変換できる便利関数があるんですね!
ちなみに、MySQLには同じような関数はないはずです。どうだ!(なにが?)
正規表現なので、改行コードの書き方は下記のような感じ。

  • \r : CR(キャリッジリターン)
  • \n : LF(ラインフィード)
  • \r\n : CRLF

同じくSQLで書いてみると、

select regexp_replace(description, '\(\r\n|\r|\n\)', ' ', 'g')
from hogetable;

こうなります。
複数の条件は「|(パイプ)」でつなげますし、第3引数で「g」オプションを渡して、一致する全ての対象を変換しています。ルールをグループ化している「(」「)」をそれぞれ「\」バックスラッシュでエスケープしてるのが少し特徴的でしょうか。(その辺はドキュメント参照)
あと、TSVの場合タブも邪魔だったりするので、

select regexp_replace(description, '\(\r\n|\r|\n|\t\)', ' ', 'g')
from hogetable;

こんな感じにすれば良さそうですね。

まとめ

まあ、色々やってみたんですが、CSVにしろTSVにしろデリミタと囲い文字がしっかりしてればフォーマットがくずれる事はないと思うんですけどね。覚えとくときっと便利ですので共有まで。

-PostgreSQL, 小技集

執筆者:


comment

メールアドレスが公開されることはありません。

関連記事

【更新】ソーシャルメディアに共有するボタンの設置方法(Twitter, facebook, mixi, GREE, Evernote, Google+, Tumblr, Pinterest, はてブ)

ソーシャルメディアの各サービスがこぞって「いいね!」などの共有ボタンをリリースしています。ブログやニュースメディアでも頻繁に目にする昨今ですが、色々なソーシャルボタンの設置方法をまとめて紹介したいと思 …

Ffmpegで複数動画ファイルを無劣化で結合したり、無劣化で切り出したりする

いつまで経ってもffmpegのコマンドが覚えられないヤガーです。 というわけで、今回もよく使うコマンドをご紹介、というか自分用メモ。 このごろイベントの撮影やライブ配信をしていて、固定カメラで動画を長 …

[N]ネタフル x [S]シカマケ = ブログデザイン勉強会 第2回:テーマ曲を決めて自分を更に深堀

昨日はブログデザイン勉強会の第2回がありました。 まずは、前回のおさらいですが1枚絵に自己紹介を描いてきて皆さんに発表。 それから、今のサイトと比べてどうかという事を他の方からご意見いただきました。 …

MovableTypeにFacebookのOpen Graph protocol(OGP)を対応させる方法

【2012/12/02:追記】 記事本文の最初にでてくる画像URLを抜き出すという目的では、元の正規表現では少々問題があったため修正しました。詳細はMTタグの解説部分のコメントをご確認ください。 ども …

検索エンジン3社が開始した、rel=canonicalの使い方

Google、Yahoo!、Live(Microsoft)の3社が「ページの正当なURL」を定義するための方法を導入する事になったようです。 headタグの中にrel=”canonical …

スポンサードリンク

スポンサードリンク