Creazy!

WEBエンジニア・ヤガーのテック・ガジェットブログ

技術情報

DBでソートの対象となるカラムはデータ型に注意すべき

投稿日:


当たり前なんだけど、意外とハマる可能性がある気がするのでメモ。
例えば、以下のようなテーブル(test)があるとします。

id name
1 太郎
2 次郎
3 三郎
10 花子
11 良子

で、以下のようなSQLを実行した場合に、

SELECT id FROM test ORDER BY id;

結果が、必ずしも「1, 2, 3, 10, 11」の順にならない場合があります(!)
それは、idのデータ型が文字列型(textとかvarcharとか)の時です。
文字列型のカラムにソートをかけた場合、文字列の1文字目から順に大小を比較していきます。
なので、結果としては「1, 10, 11, 2, 3」の順になります。
また、同じテーブルでMAX関数を使った場合、

SELECT MAX(id) FROM test;

その結果が「11」にならず「3」になる事も同様の理由です。
ね?結構しでかしちゃいそうでしょ?


さて、上記ふまえてソートに使われそうなカラムにどのデータ型を使ったらいいか考えてみる。

普通に数値型(integerとか)でいいんじゃないか?

PrimaryKeyとかIDになりそうなユニークなカラムは数値型でいいと思う。桁が変わる事があるのでちょっと気持ち悪い気がするけど。

文字列型(textとかvarcharとか)を使う場合

間違っても文字列型の中に、数字っぽい値をいれてはいけない。
理由は冒頭で説明した通り、ソートしたりMAX値を取得した時に思った値が返ってこないから。
で、良くありそうなのが接頭字を付けるパターン。
「id001」とか「N0001」みたいな。
この場合気を付けなきゃいけないのは必ず桁を「0」で埋めて固定長にする事。
「id98, id99, id100」をソートすると「id100, id98, id99」になっちゃうから。
「id098, id099, id100」 であれば思った通りの順番になる。
あとは、固定長といっても接頭字なしで「0」埋めしても良くない事が起こるかも。
「00001」「00002」「000003」・・・
なぜかというと、思わぬところで数値型に変換されちゃうかもしれないから。(JSとかで)
つまり、「”00001″」だったものがいつのまにか「1」になっちゃう事があるから。(詳細省略)

まとめ

スミマセン、まとまりませんでした。
ネタ的には完全に出オチでしたね。冒頭部分だけ見て下さい 🙁

-技術情報

執筆者:


comment

メールアドレスが公開されることはありません。

関連記事

各ソーシャルブックマークサービス(SBM)のブックマーク数画像表示APIを調べた

GYM Search にも「del.icio.us」「はてなブックマーク」「livedoor clip」「Yahoo!ブックマーク」の各ブックマーク数を表示したんだけど、それぞれ表示される画像の仕様や …

picplzの全投稿サマリーを統計してバックアップできる「thx!picplz」を作りました

・picplzが7月3日で全サービス終了→一括ダウンロード方法など [C!] 先日、picplzのサービス終了を速報でお知らせしたのですが、以前作ったPHPでのダウンローダーはやはり敷居が高かったよう …

「FastIcns」Mac用のアイコンが超簡単にできるちょっと変わったソフト

Gyamblrを作った時に、アイコンの作り方が分からなかったので調べてみたら辿り着いたソフトを紹介します。 ・FastIcns « DigitalWaters.net Projects

no image

はてなブックマークのコメント一覧非表示機能についてのツッコミ

はてなブックマークのコメント一覧をブックマークされる側のページにmetaタグを書く事で非表示にできる機能が付きました。 ・はてなブックマークのコメント一覧非表示機能について – はてなブッ …

Twitterの古い公式ウィジェットが使えなくなるのでご注意を!

すっかり忘れ(たフリをし)ていましたが、Twitter API v1.1への移行期限3月5日までおよそ1ヶ月と迫ってきており、開発者各位におかれましては対応状況は如何でしょうか?ボクはかんばしくありま …

スポンサードリンク

スポンサードリンク