Googleを支える技術 ‾巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ)
西田 圭介 技術評論社
グループ:Book /ランキング:405
価格:¥ 2,394
発売日:2008-03-28 /通常24時間以内に発送
カスタマーレビュー
おすすめ度:
既存の枠に捉われていてはGoogleを超えられない 
(2008-06-22)
個人的に最近、新しい職場(やや大規模なWEBサイトの開発・保守)へ移動し、「パフォーマンスが足りない!」とか「ディスク容量が足りない!」という場面に良く遭遇するようになった。そこで実感したのは、現在一般的に使われているデータベースやプログラム環境が、意外とスケーラビリティに乏しいという事。高価なロードバランサやRAIDがあっても、頼れる部分は僅かで、あとは、なんとかかんとか小手先の工夫で乗り切らざるを得ない。
そんな既存のアーキテクチャの限界を感じている最中に、本書を読み始め、大変興味を覚えた。なるほど、Googleの凄さを見せつけられてしまう。推定50万台以上ものサーバをスケールさせるのに、これほど独自性の高い手法を使っているとは。他社が脅威とする理由が分る。学術レベルでは既知の技術を応用しているだけだというが、これを世界で最初に実装するなど、容易くできることではない。
この本の著者は、これらgoogleの技術を、わずかに発表された論文を手がかりに推察したとのこと。立派な仕事だと思う。
しかし正直、本書の説明だけでは、「なぜこの手法が有効なの?わからん」と思う場面が多くあった(単に私の技術力が低すぎるせいで、理解できないのかもしれないが)。全体に読みやすく良書だが、まだまだ手落ちの部分もあると思う。
自分で英語の論文を読み解くのはつらいので、同じ著者の続編や、類書の出版を期待したい。
マイクロソフトや、まつもとゆきひろ氏も、クラウドコンピューティングフレームワークの開発に乗り出しているという話なので、今後はこの手の情報が必要不可欠なものになっていくと思う。需要は高い。現時点でこの本は、SE必読の一冊といえる。
なかなか掘り進んでいて良いことは良いです。 
(2008-05-27)
最初とても読みやすい本だなぁと思って読み始めたのですが、
だんだんと検索エンジンの仕組みの深い部分へと入っていくにつれ
文章が読みにくくなっていく感じがしました。
どこまで知りたいかというのは個々人それぞれでしょうが、
全部の領域を知らなくても、自分に興味のある領域を読めるように
構成に工夫して欲しかったなぁと思います。
検索エンジン一つとっても莫大かつかなり幅の広い知識が必要なので
読み手の方にもその領域をカバー出来るほどのそれ相当のレベルが
必要なのかなと思いました。
ソフト屋の皆さん。Googleはここまで行った。 
(2008-05-25)
本屋さんの店頭に"Google XX"という本がいっぱいありますが、殆どが「使用マニュアル」です。
本書はさっと中身を見てビックリしました。Googleの内部技術を扱っています。
Google社員が書いているのか?いや!なんと初出版の日本人が著者!
「こんな内容をGoogle社員でもない日本人が書けるわけがない」
と思って読み進めるとカラクリが少しわかりました。ここで知りましたが、Googleの技術は論文として広く公開されていて、本書はその内容をまとめていたのです。但し論文はもちろん英語で散在し、それぞれが難しい。
話は大きく3つ
=1.検索エンジンのアーキテクチャと分散技術
全て理解できていないのですが、すごいと思う。
Googleが前人未到のデータ(地球上のWeb全部)を扱うための技術・アイディアがちりばめられており、大きめのシステムを設計するときには一読しておくと役立つ場面があるのではないでしょうか。
=2.消費電力軽減策
最近、Googleがエコ分野に進出しようとしていますが、なぜだかわかりました。
あまりにサーバが多いので、消費電力に苦労しているのです。その苦労した結果の論文は一般でも役立ちそうです。
=3.開発体制
実際に使っているツール等が示されています。
それぞれ、元になった論文の詳細リンクが示されていますので、そちらもあわせて見ると良いと思います。
数年ぶりにソフトウェア関係で「ガツン」とやられた感じがする本です。
ソフトウェア技術って枯れてきていると思っていましたが、Googleの中で進歩していました。文書の公開がWeb上で日本語化されていないので、乗り遅れてしまったようです。
本書は直ぐに何かに役立つというものはありませんが、最新技術を垣間見ることができ、多くの気付きを得ることができます。お勧めです。
理論はわかるのですが。。。 
(2008-05-23)
大変難しい本でした。分散ストレージに関する章あたりから、ついていけなくなりました。書いてることを理論としては理解できるのですが(理論は簡単)、なぜそれが高速化などにつながるのか、理論と現実とのつながりがイメージしづらくて、理解できなくなってしまいました。。。
Googleの仕組みを理解することで、SEOやSEM対策に役立てようと思ったのですが、SEOに役立つ情報はほとんどありません。キーワードの取扱いについても、技術的なインデックスの仕組みの解説なので、検索ヒット率を高めるための参考情報、たとえばどのようにキーワードを解析しているか、などはありませんでした。
本書は主に公開されている論文などの情報を整理し、その公開された技術を解説したものです。結構古い論文なども出てくるので、現在のGoogleの実情をどこまで反映しているか不明ですが、よく研究がなされていてきれいにまとまっている本だと思います。
あの検索エンジンの中身が一目でわかる 
(2008-05-09)
googleが誇る大量データ処理技術の中身が分かります
少し突っ込みが足りないところはありますが、大規模分散アーキテクチャをこれから勉強したい方にはベストプラクティスではないでしょうか
分散アーキテクチャで鍵となる信頼性向上手法についても分かりやすく触れられています
航空予約システムなど、社会インフラシステムが大規模分散システムに向かって行く中、これからアーキテクチャ設計を学ばれる方には教科書の一つとしてお勧めです。