Creazy!

WEBエンジニア・ヤガーのテック・ガジェットブログ

技術情報

勝手に添削:bookmarklet – ページに含まれるURLを抽出してTSVにする

投稿日:


一回やってみたかったんだ、「勝手に添削」
しかも、dankogaiさんの(笑)
お題は下記です。
CodeZine:Webページに含まれるURLを抽出し、Excelにまとめて保存する(HTA)
404 Blog Not Found:bookmarklet – ページに含まれるURLを抽出してTSVにする
IEだけじゃイカンという意味では、danさんの記事に賛成。
ですが、

例えばSafari3では下がうまく行かず(ウィンドウに何も表示されない)、Firefox2では上がうまく行きません(一行しかpromptに入らない)。OperaはどちらもOK(優秀!)。IEは未確認(報告お願いします)。ブラウザーにあわせて使い分けて下さい。

via: 404 Blog Not Found:bookmarklet – ページに含まれるURLを抽出してTSVにする

というわけで、クロスブラウザになってませんねw
FFのpromptに複数行の文字列を入れられないのはどうしようもないので、別ウィンドウに開く場合にSafariで動かない件に対応してみましょう。
Extract Links as TSV (window)

javascript:(function(){w=window.open('','');d=w.document;d.open();d.write('<plaintext>'+(function(a){var r=[];for(var i=0;i<a.length;i++)r[i]=a[i].innerHTML+'\t'+a[i].href;return r.join('\n');})(document.getElementsByTagName('A')));d.close();})();

多分、document.open();document.close();を省略したのがマズかったんじゃないかと思います。あと、voidで全部を囲ってるのもあやしいかったけど、とりあえず上記で、IE/FF/Safari動きます。
更に、上記で出力したページからWin+IEで小ピーしてExcelにはりつけてもうまくセルに合わなかったので、<plaintext>じゃなくて<textarea>に出力したらうまくいきました。
‘+(function(a){var r=[];function e(s){return s.replace(//g,’&gt;’);}for(var i=0;i ‘+e(a[i].innerHTML)+’ ‘+e(a[i].href)+’

‘;return r.join(”)+’‘;})(document.getElementsByTagName(‘A’)));d.close();})();”>Extract Links as TSV (window+table)

javascript:(function(){w=window.open('','');d=w.document;d.open();d.write('<ta'+'ble border=1>'+(function(a){var r=[];function e(s){return s.replace(/</g,'&lt;').replace(/>/g,'&gt;');}for(var i=0;i<a.length;i++)r[i]='<tr><td>'+e(a[i].innerHTML)+'</td><td>'+e(a[i].href)+'</td></tr>';return r.join('')+'</ta'+'ble>';})(document.getElementsByTagName('A')));d.close();})();

enjoy!

-技術情報

執筆者:


comment

メールアドレスが公開されることはありません。

関連記事

ドラゴンボール全巻がYouTubeで無料配信!ページめくりが速すぎる場合のスロー再生方法

つい先日攻殻機動隊S.A.C全26話無料配信でウハウハしたばかりですが、今度は名作漫画ドラゴンボールを全巻配信だそうです! MANGAPOLO Official Manga Channel &#821 …

no image

「勝手にブログ評論」されてみた

ネタですが。 土曜日、ぼーっとしているついでに検索エンジンの高速化をするにはどうすればいいのか考えた挙げ句、固有名詞を抜き出すプログラムを書いて、その実験を繰り返していたところ、実験の方が面白くなって …

百度(Baidu)ファーストハッキング

タイトルは釣りです。ゴメンナサイ。 1/23に中国産の検索エンジン「百度(baidu)」が日本でのサービスを本格開始しましたね。エロに強いだとか、MP3検索どうした?とか、ちょっと横道な話題が多い気が …

PageRank が 4 に、SEO TOOLS では A 評価になりました

このブログは自分の実験場所的な意味もあるので、SEOとか色々やってみては効果を確認するというサイクルを、自分のペースでゆるーく実践しているのですが、昨日久しぶりにSEO TOOLSをチェックしてみたら …

no image

EXIFについて改めて考える

EXIFについての誤解(とオレは思っている)がまだまだネット上で存在しているようです。 撮影時刻と撮影場所が特定できれば、その人のプライベートな行動まで分かってしまうことも考えられる。つまり、個人情報 …

スポンサードリンク

スポンサードリンク