twitterの非公式RTを階層表示

1402res/h 【東日本大震災】 米「タイム」が指摘 日本の支援は途上国以下  政治の怠慢が被災者を見殺しにした
http://2chradio.com/arc/newsplus1300956137.html


これを題材に非公式RTの階層構造表示に取り組んでるんですが、
非常に難しい。


tweet欄に [@id:コメント]という表記があった場合に
@idに対するコメントとして、hashに積算しておいて、
2passで、TREE表示しようと思ったんですが、
RT元の人が2回以上RTしている場合に、
どっちのRTにぶらさがるかを判定する方法が、
RTするときのテキストしかない。
(これは、そもそも非公式RTを「どの記事に対するものか?」で
判断する場合に言える。TOPSYなんかはURLで判断しているようだけど、
2chradioの場合、URLがなくても見出し一致でも検出している)


RTするときに元RTのコメントを短縮する場合もあるし、
id+元RTコメントをkeyにhashにいれておいても、
今度は元RTを表示するときに、子のRTはどれか?を引くためのキーが
完全に特定できない。
元RTを完全に改変してない場合だけ、階層表示を行う
あたりが落としどころかもしれない。



二回以上RTしている人に個別にRTされた場合のRT先とか、
RTされた人がRT返信したりした場合に、
対応がおかしくなる場合がありますが、
ただ、時系列に並べるだけよりはましかと思うので、
しばらく今のようなRT表示で行ってみます。

http://2chradio.com/arc/dqnplus1301035349.html


こうやって見てみると、はてなブックマーク
コメントの階層関係がないですね。
2chの場合はレス番号で対応関係が明確だからいいけど、
自然発生したtwitter非公式RTは機械には取り扱いが難しい。