Creazy!

WEBエンジニア・ヤガーのテック・ガジェットブログ

PHP 小技集

Public Domain classic のクラシック音源、約4200曲をPHPで遠慮なくダウンロード

投稿日:


Public Domain classic
パブリックドメイン・クラシック
数日出遅れていますが、日本での著作権保護期間が終了し、パブリックドメインとなったクラシック音源を約4200曲も公開しているスゴイサイトが話題になっています。MP3形式で全て無料でダウンロードできるということで、クラシックとか良く分からないオイラなんかも気軽に聞くことができて嬉しいです。
で、せっかく全部ダンロードしてよいと言っていくので、PHPを使ってありがたく全部ダウンロードさせてもらおうかなと(え


こんなバッチファイルを書いて、
・public_classic_mp3.php

<?php
$url      = 'http://public-domain-archive.com/classic/search.php?keyword=%25';
$limit    = 10;
$max      = 4293;
$save_dir = '';
$opts = array(
'http'=>array(
'method'=>"GET",
'header'=>"User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; InfoPath.1\r\n"
)
);
$context = stream_context_create($opts);
for ( $i=1; $i<=(($max/$limit)+1); $i++ ) {
$page = '&tmn='.$max.'&page=' . $i;
echo $url . $page . "\n"; // debug
$html = file_get_contents($url . $page, false, $context);
$regex
= '<a href="download.php\?album_no=[0-9]+">(.+?) - (.+?)<br>'
. '(.+?)<\/a><br>'
. '(.+?) - (.+?) \([0-9:]+\)<br>'
. '<a href="(.+?)" class="dl">.+?<\/a><br><br>';
if ( preg_match_all('/'.$regex.'/',$html,$matches) ) {
//var_dump($matches);
$artists = $matches[1];
$albums  = $matches[2];
$songs   = $matches[5];
$mp3s    = $matches[6];
for ( $j=0; $j<count($matches[0]); $j++ ) {
if ( strpos($mp3s[$j],'file') === 0 ) {
$dl = 'http://public-domain-archive.com/classic/'.$mp3s[$j];
} else {
$dl = $mp3s[$j];
}
echo $dl."\n"; // debug
preg_match('/([0-9]+)\.mp3$/',$dl,$match);
$id = $match[1];
if ( !is_dir($save_dir.rep($artists[$j])) ) {
mkdir($save_dir.rep($artists[$j]),0777);
}
if ( !is_dir($save_dir.rep($artists[$j]).'/'.rep($albums[$j])) ) {
mkdir($save_dir.rep($artists[$j]).'/'.rep($albums[$j]),0777);
}
$save_file = $save_dir.rep($artists[$j]).'/'.rep($albums[$j]).'/'.$id.'_'.rep($songs[$j]).'.mp3';
echo '-> ' . $save_file . "\n"; // debug
if ( !file_exists($save_file) ) {
$mp3 = file_get_contents($dl, false, $context);
file_put_contents($save_file,$mp3);
}
}
}
}
function rep($str) {
$from = array(" ","\\","/",";",":","*","?",'"',"<",">","|");
$to   = array("_","¥","/",";",":","*","?",'"',"<",">","|");
$str = str_replace($from,$to,$str);
return $str;
}

こんな風に起動すればいいかな、

$ php -f public_classic_mp3.php

1ファイルずつ落としていくので、急激な負荷はかからないと思いますが、たくさんの人がこれやっちゃうとサーバ大変だと思うので、これ以上の説明はあえてしませんw

まとめ

えーと、誰かに怒られたらエントリー削除する可能性もありますw
とりあえず、のだめ以外はクラシックとか全く関わりがなかったので色々聞いてみたいと思います。癒されるかも!
ベスト・クラシック100 プレミアム
B001CRGT78
のだめカンタービレ 最終楽章 前編&後編
B002QD2SBI
チャイコフスキー:ピアノ協奏曲第1番
B002WEBZR4
↑この人、今日の特ダネで小倉さんが紹介してた美人さんだ。

-PHP, 小技集

執筆者:


comment

メールアドレスが公開されることはありません。

関連記事

no image

Smartyで配列のダンプを表示させる5つの方法

Smartyといえば、言うまでもなくPHPの中ではとても有名なテンプレートエンジンです。自分でも長い事使ってきたんだけども、使い方が分からなくて困るほど難しい事をしてこなかったせいか全然深いところまで …

TumblrにOGP設定してみた

【2011/06/21:追記】 あまりにも適当に書きすぎて分かりにくかったのでサンプルコードの中で差し替えが必要な部分について説明加筆しました。 メインブログのMTにOGP設定をしたのが良いキッカケに …

Safariでページを大回転させるブックマークレット

Safari限定ですが、WebKit transformationを使ってページの表示角度を変えられるんだそうです。 Ajaxianに出てた。Safariブラウザだけの機能。 -webkit-tran …

Googleドキュメントのフォーム機能からGoogle Apps Scriptを使ってメール送信

【2014/12/26:追記】 この記事はGoogleの仕様変更などで内容が古くなっていたため、最新の情報で書き換えました。 リンク先の記事を参照してください。 Googleドライブのフォーム機能から …

BingをGoogle Analyticsで検索エンジンとして認識させる方法

Microsoftが満を持して(?)投入してきた次世代検索サービス「Bing」ですが、全然ダメって言われたり、エロいって言われたり、どちらかというと評判よくなさそうな感じですね。 6月1日にプレビュー …

スポンサードリンク

スポンサードリンク