0


0

Twitterライブ検索

Twitter-Live Searchをリバースエンジニアリングしようとしていました。 ここで議論できるかもしれません。 *「1秒前」*などの最新のツイートでも表示される機能について話している。 以下がどのように起こるかを理解しようとしています-

  1. ユーザーがツイートするときとインデックスを作成するときの間にレイヤーが必要です (更新)が発生します。 このレイヤーはMySQLまたは他のキャッシングレイヤー(memcached、cassandra)ですか? 多分…​

  2. *インデックス作成-*インデックスの更新はどのように行われますか? 彼らはできません おそらく新しいインデックスをゼロから作成しますか?

  3. *インデックス作成-*ここには分散インデックスが必要です。 すべてを更新する方法 あるインデックスの古いデータと他のインデックスの最新データを提供する必要のないインデックス

  4. *インデックス作成-*または、このようなことが発生しても問題になりますか? 正直私はそうは思わない:)どのユーザーが気付くでしょう…​

誰もが追加/議論する興味深いものを持っています。 私は理解しようとしています…​

1 Answer


0


確かに興味深いが、それは「アーキテクチャ」の質問であり、実際にはプログラミングの質問ではないと思う。

しかし、参考までに、高いスケーラビリティには多くの情報があります:http://highscalability.com/blog/category/twitter[twitterでタグ付けされた投稿]

彼らはすべてのツイートを保持していますか? 私の推測では、彼らはしばらく後にそれらを捨てるだけであり、確かに彼らはACIDプロパティを必要としませんか? ..

そして、私があなたの場合、それらのタイムスタンプを信用しません:)