このブログの読んだ本シリーズは、ブクログに登録してあるデータを引っ張ってきている。きっかけは@kentaro さんのブログの読んだ本をブクログでふりかえるシリーズ1。
ブクログは登録データの編集がやりやすくて気に入ってる2のだけれど、唯一残念なのがタイトルにも挙げた「Kindle 本が bookmarklet で登録できない」というところ。ブクログ Kindle ストア対応が2012年10月で以後ずっとできてないっぽいし、Chrome 拡張もあるしでこのままだと対応の望み薄か!?
ということで、重い腰をあげて javascript を眺めてみることに。なお当方、これが初の javascript いじり。
以下、調査経過を含め結構な長文なので、修正した bookmarklet が欲しい方は以下をどうぞ。
直してみた(1) 状況証拠集め
bookmarklet 実行時挙動の違い
Amazon.co.jp: 剣客商売 (新潮文庫―剣客商売): 池波 正太郎: 本とAmazon.co.jp: 剣客商売一 剣客商売: 1 eBook: 池波 正太郎: Kindleストアで bookmarklet を実行し、挙動を調べたところ、URLクエリパラメータ3の部分に違いが一つ見つかった。
クエリパラメータは全部で4つあるのだけど、a= で定義されているパラメータが Kindle 本の場合だけ存在しない。a で始まってるし、このパラメータ、おそらく ASIN だろうなぁ、と。で、Amazon での検索に不可欠な ASIN が URLクエリパラメータ として渡されてないのでは!
詳細は以下の通り。
うまくいくケース(紙の本の場合)
- Amazon.co.jp: 剣客商売 (新潮文庫―剣客商売): 池波 正太郎: 本を表示した状態で bookmarklet を実行
- 処理用の新しいタブが開く
- 2.のタブが、1.の本が選択された状態のブクログ登録画面へと遷移
- 本を登録する
なお、手順2. で開くタブの URL は以下の通り。
1
| |
うまくいかないケース(Kindle 本の場合)
- Amazon.co.jp: 剣客商売一 剣客商売: 1 eBook: 池波 正太郎: Kindleストアを表示した状態で bookmarklet を実行
- 処理用の新しいタブが開く
- 画面が遷移せず、ブランクなタブが開いたままになる
なお、手順2. で開くタブの URL は以下の通り。
1
| |
ブクログ提供の bookmarklet
2013/09/10 時点で公式に提供されている bookmarklet は以下の通り。
1
| |
冒頭の var で始まる変数宣言部分がセミコロンのところまで延々と続き、そのあとに if - else な一文がきて、最後はおまじない的な void(0) でおしまい、と。javascript はセミコロンで文と文を区切るそうなので、以後は改行を入れつつ眺めていく。
直してみた(2) if - else 部分を眺める
1 2 | |
先に2行目を見てみると、
1行目の条件に当てはまらない場合は関数 a を実行する
ということらしい。で、1行目の条件って何かというと、どうも Firefox のみが対象みたい。setTimeout() というメソッドを使って、Firefox のときだけ、0ミリセカンドの遅延を発生させたあとに関数 a を実行するってことになってる。
なんでこんなことしてるんだろ…不具合対策?
ともかく、if - else 部分で関数 a を実行したいってのは分かった。で、肝心の関数 a ってなんなのよ!というのはこの次で。
直してみた(3) 関数 a の正体とは?変数宣言部分を眺める
javascript の変数宣言はカンマで区切れば一括してできるそうなので、カンマごとに改行してみる。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | |
関数 a キターーー!!ASIN キターーー!!
ということで、ググっと近づいてきた。
関数 a の正体
上記14行目が関数 a の正体。function() で記述が始まる関数を匿名関数といい、このケースでは { 以降に続くその中身は open メソッド。新しいタブで u を開いてね、という意味みたい。
んで、その u だけど、13行目にある f+p、つまり http://booklog.jp/blet?v=2&u='+e(l.href)+'&s='+e(s)+'&a='+e(a) のこと。URLクエリパラメータきましたよっ!!Kindle 本の場合だけ存在しなかった a= の部分を見てみると、e(a) となってる。
eはencodeURIComponentの省略(11行目)aは 12行目時点では(g?g.value:'')(10行目で定義されてる)
もう、g って何よ!正解は9行目の d.getElementById('ASIN')。文章内から指定した ID の要素を取得するメソッドで、このケースでは1行目の d、開いているページのソースから ASIN という ID がつけられている要素をとってくることになる。
で、とってきた要素使って10行目で条件分岐させてるのだけど、ここでよくある if 文じゃなくて ?: を使ってる。これは、? の左側が true なら : の左側を、false なら : の右側を、という書き方。それを踏まえてさきほどの e(a) を読み直すと、
- ID がASIN の要素があればその値を
encodeURIComponentでエンコードした値 - そんな要素がない場合は
''をencodeURIComponentでエンコードした値
が返ってくることになる。これ、後者の場合は何も返ってこないことになる。Kindle 本の場合URLクエリパラメータが a= だけで返ってきていたのは、10行目の条件分岐処理の結果のようだ。
消えたASIN を探せ!
紙の本のページの HTML ソースで ID が ASIN の要素を探すと
1
| |
というのが見つかる。おお、ASIN という ID で取得した要素の値、value、がURLクエリパラメータのそれと一致しとる!!
で、次にKindle 本のページの HTML ソースを見てみる。思った通り、ASIN という ID が付与された要素が存在しない。代わりに使えそうなものはないのかっ!!ソースを行ったり来たりしてると、
1
| |
というのが見つかった。ASIN.0 って何ですか… ID はないけれど NAME があるので、getElementsByName というメソッドが使えそう。これは、指定した NAME と合致する要素をリスト形式で返すメソッドらしい。NAME を指定する記述のあと、[0] といった具合でリスト内の位置を指定するとその位置の要素だけ返ってくるようなので、今回のケースでは d.getElementsByName('ASIN.0')[0] とすればよさそうだ。
直してみた(4) ASIN の値を取得、変数に代入する方法を見直す
変数 g に紙の本の ASINコードを含む要素が入ってるのだから…
- 変数 gk を作る
d.getElementsByName('ASIN.0')[0]で取得した要素を代入する?:の条件分岐を、g の値か gk の値か、という分岐に変える
という修正方法がパッと浮かんだのだけど、変数増やすのイマイチだなぁと一思案。Pocket の bookmarklet に、「 || で論理和」な以下の記述を見つけた。
1
| |
この例だと、 t.getElementsByTagName('head')[0] が true ならそれを、false なら t.documentElement を変数 o に代入する、という書き方で、これを修正案として採用。ブクログ bookmarklet の ASIN 要素取得部分
1
| |
を、
1
| |
に直してみた ↓ 。
直してみた(5) おまじない void(0) 部分
ここまでで当初の目的は達成してるのだけど、せっかくなので最後の一文、
1
| |
も見ておく。The void operator in JavaScript によると、
bookmarklet を実行して
undefined以外が返された場合、開いているページがその返された内容で上書きされる。void(0)と書くことで、返る値がundefinedになり、開いているページに変更が生じなくなる。
とのこと。void(0) なしでも Chrome では影響なかったけど、Firefox だと画面が数字の羅列に変わってしまった。その対策ってことなんでしょう。
調べてゴリゴリと直すだけでも大変だけど、経過や背景を文章にまとめるのはもっと大変だ…とりあえず直せてよかった。思わぬ形だったけど、少しは javascript を理解できて満足しとります。