Creazy!

WEBエンジニア・ヤガーのテック・ガジェットブログ

技術情報

DBでソートの対象となるカラムはデータ型に注意すべき

投稿日:


当たり前なんだけど、意外とハマる可能性がある気がするのでメモ。
例えば、以下のようなテーブル(test)があるとします。

id name
1 太郎
2 次郎
3 三郎
10 花子
11 良子

で、以下のようなSQLを実行した場合に、

SELECT id FROM test ORDER BY id;

結果が、必ずしも「1, 2, 3, 10, 11」の順にならない場合があります(!)
それは、idのデータ型が文字列型(textとかvarcharとか)の時です。
文字列型のカラムにソートをかけた場合、文字列の1文字目から順に大小を比較していきます。
なので、結果としては「1, 10, 11, 2, 3」の順になります。
また、同じテーブルでMAX関数を使った場合、

SELECT MAX(id) FROM test;

その結果が「11」にならず「3」になる事も同様の理由です。
ね?結構しでかしちゃいそうでしょ?


さて、上記ふまえてソートに使われそうなカラムにどのデータ型を使ったらいいか考えてみる。

普通に数値型(integerとか)でいいんじゃないか?

PrimaryKeyとかIDになりそうなユニークなカラムは数値型でいいと思う。桁が変わる事があるのでちょっと気持ち悪い気がするけど。

文字列型(textとかvarcharとか)を使う場合

間違っても文字列型の中に、数字っぽい値をいれてはいけない。
理由は冒頭で説明した通り、ソートしたりMAX値を取得した時に思った値が返ってこないから。
で、良くありそうなのが接頭字を付けるパターン。
「id001」とか「N0001」みたいな。
この場合気を付けなきゃいけないのは必ず桁を「0」で埋めて固定長にする事。
「id98, id99, id100」をソートすると「id100, id98, id99」になっちゃうから。
「id098, id099, id100」 であれば思った通りの順番になる。
あとは、固定長といっても接頭字なしで「0」埋めしても良くない事が起こるかも。
「00001」「00002」「000003」・・・
なぜかというと、思わぬところで数値型に変換されちゃうかもしれないから。(JSとかで)
つまり、「”00001″」だったものがいつのまにか「1」になっちゃう事があるから。(詳細省略)

まとめ

スミマセン、まとまりませんでした。
ネタ的には完全に出オチでしたね。冒頭部分だけ見て下さい 🙁

-技術情報

執筆者:


comment

メールアドレスが公開されることはありません。

関連記事

Officeファイルを圧縮・軽量化してくれる「NXPowerLite」

一昨日のライフハッカー[日本版]ローンチ記念イベントで協賛されていたオーシャンブリッジさんから、お土産としてNXPowerLiteというソフトウェアをもらってきました。 折角、製品版を頂いたのでレポー …

Googleスプレッドシートのチェックボックスを便利に使う方法

2018年中旬、Googleスプレッドシートにチェックボックス機能が搭載されました。エクセル同様に、計算式やGAS(Google Apps Script)による高度なカスタマイズで、ビジネスの効率化に …

TopHatenarでこのブログを調査

TopHatenarがはてな意外のサービスにも対応したようです。 はてなダイアリーのランキングサイトとして公開してきたTopHatenarですが、今回、はてな以外の全ドメインのブログに対応しました。 …

Macである拡張子のファイルを開くデフォルトアプリケーションを指定する

少し前から、MacのエディタをmiからCotEditorにスイッチしました。それに合わせて、エディタで開きたい拡張子(例えば .txt、.html、.css、.js、.phpなどなど)のデフォルトアプ …

no image

SD-PIMってなに?携帯でminiSD/microSDカードをチェックディスク/フォーマットする方法

携帯Docomo P905iに機種変更してからというもの、PCから画像やら動画やら音楽やらのデータを携帯に転送する事がとても多いんだけど、基本的にはUSBカードリーダー経由でmicroSDに書き込む事 …

スポンサードリンク

スポンサードリンク