「ひぐらしのなく頃に」OPアニメ・宇多田ヒカル「SAKURAドロップス」PV画像比較

http://blog.livedoor.jp/higurashi_utada/

うわ、同じジャン(・∀・;)
そういえば、mugiさんが「ひぐらし」が面白いとこのまえ言ってましたが、アニメになるんですね。
この手のパクリって、「成恵の世界」と「新海誠さん製作のwindのOP」がそっくりというのも過去にありましたね
(windも伺かパクッてるんじゃないかと思いましたが。髪が青いし)



http://72.14.235.104/search?q=cach(略



http://www.google.com/search?hl=ja&inlang=ja&ie=Shift_(略


しかし、検索してみたらほとんどまともな資料が無い。
インターネットってちょっと古いことになると、とたんに情報がなくなりますね(^^;

みさきニュース2.0開発室

みさきニュースもあまりアクセスはありませんね(^^;
やっぱり、トップニュースというか、これだけ見てればみたいなランキングがいりますねえ。
クリックランキングはやるつもりですが、それも利用者がいないと成り立たないし。
やはり、ブログを大量にクロールして、重なって言及しているURLのランキングをやるという方向が
いるのかなあ。
せめてmisakidexみたいに、個人ニュースサイトを複数巡回して、重複をチェックする方向かなあ……
(要するに、はてブですが)
あと、全体をカバーしすぎなので、


サイエンスだけ、とか、エンタメだけとか、もっと方向性を絞るのもありかもしれない。
その場合は、blogサーチなどを活用して、専門機械化ポータルを作るって方向ですねえ。
これは、すでのトレンドサーチなんかで実用化されてるものがありますねね。
やるなら、たとえば、4コママンガに関するポータルとか、伺かに関するポータルとか、
どっちかというと自分の興味がある分野でやればいいんでしょうけど、
ちょっと今は特定の何かに興味はないですね……
以前ならDVDレコーダーとかありましたけど。




総合でやるなら、機械ニュースの究極の目標は、現在の個人ニュースサイトのような、
厳選されたニュースの一覧を作ることだと思うので……
昨日は、情報要約の手法について考えてましたが……


2chをターゲットにするものはやらないといかんですね。
中身が見れなくても、スレッドタイトルだけを処理するなら、負荷もないし、
わりと楽だと思うし。


あと、高田馬場に行ったんで、ブックオフに寄ったけど、さすが早大が近いだけあって、
よさげな本がいっぱいあった。

そこで買ったのが

「意味論1−形式意味論−」杉本孝司(くろしお出版
http://www.amazon.co.jp/gp/product/4874241557/249-5818077-2893163?v=glance&n=465392
「コネクショニストモデルと心理学」守一雄・他(北大路書房
http://www.amazon.co.jp/gp/product/4762822191/249-5818077-2893163?v=glance&n=465392


意味論は理系向けの自然言語処理の本しか読んだことがなかったので、上記は文型向けなのでしっかり書いてある。
コネクショニストも、本来、心理学の研究者向けの本と思うけど、GAからニューロ、それも時系列のニューロの手法が、
図解入りで、たいへん詳しく書いてあって、すごく良いです。


高田馬場まんがの森ははじめて行ったけど、あずまんが大王の各キャラごとのサイン色紙が飾ってあって、
品揃えもすごくいいんだけど、日曜の昼下がりとは言え、客が自分ひとりだったのが不思議(^^;そんなもんですかねえ

関連記事検索の実装

単語検索に関しては、関連記事検索を実装しているんですが、
関連語をはてなAPIから取得して検索してます。
ただ、はてなAPIの関連語は、強力は強力なんですが、むだなゴミな単語も入ってくるので、
なかなかうまく集約できませんねえ
たとえば「セーラー服と機関銃」だと、「監督」とか「映画」とかあまりに一般的な単語まで含まれるため、
むだが多いです。



http://props.s73.xrea.com/rss/index.cgi?act=search&search=%(略

Search for "セーラー服と機関銃"

・25年ぶりのカ・イ・カ・ン!長澤まさみ連続ドラマ初主演で甦る「セーラー服と機関銃」 TBS

http://www.sanspo.com/geino/top/gt200606/gt2006062201.html 

【関連キーワード】 powered by Hatena 
長澤まさみ| 薬師丸ひろ子| リメイク| TBS| 緒形拳| キャスト| 監督| 映画| 風祭| リスト::日本の映画::題名::さ行|
 番組| プロデュース| 大門| 石丸彰彦| キャラクター| 原作| 佐久| 物語| 伊與田英徳| 渡瀬恒彦| 相米慎二| スタート|
 赤川次郎| 主人公| 林家しん平| 角川映画| 

【関連記事】 
・84pts TVアニメ 『貧乏姉妹物語』 キャラクター更新
・78pts くりらじ、「ツール・ド・フランス」のポッドキャスト番組を配信--スカイプを活用
・78pts USEN、「どこでもUSEN」でライブドアのコンテンツを使った新番組配信スタート
・72pts S・スピルバーグ氏が映画「Warcraft」の監督に,という噂
・72pts import otsune from Hatena - 「軽音楽だと「こんなんでよかったのかな」って空気読めるのに、自主制作映画のダメさが理解できない超監督ハルヒは、なんか能力設定がチグハグじゃないか?」
・48pts カレイドスターキャラクターボーカルアルバム発売イベント「Applause again」レポート掲載!
・48pts 様々なキャラクターコスチュームを手がけるCOSPATIOで、しまぱんまつりを実施
・48pts ビタミン 『どうして?いじってプリンセスFinalRoad』 サンプルCG&キャラクター追加
・48pts キャラクターに翼&羽が生える!『スカッとゴルフ パンヤ』に新アイテムが登場
・48pts 『BLEACH 〜ヒート・ザ・ソウル3〜』 新システムとキャラクターを紹介!


なので、方向性として、むだな関連語を削除する方向で進める予定です。
重要なのは「固有名詞」です。
固有名詞>地名などのやや抽象の固有名詞>抽象名詞>副詞・形容詞・動詞


固有名詞は、形態素解析エンジンでも処理できません。そもそもエンジンは巨大とはいえ「できあいの辞書」で処理してるだけですからね。
そこで重要なのは、やはりはてなキーワードのような日々更新されるキーワードの情報です。
しかし、なにが固有名詞か判断するのは難しいです。じゃ、どうするのか? キーワードから、形容詞・副詞・動詞・一般名詞を引けばいいんですよ。消去法です。


文章要約の手法でも考えてるところですが、言語というのは「名詞」と「動詞」の距離ですよ。
これは、英語も日本語も関係ないです。
この考え方で、2chのスレッドを要約する手法も開発するつもりです。



そういえば、いずみさん原作の「貧乏姉妹物語」アニメ化ですね。HDDレコで予約かけてます。
声優も、金田朋子さんと坂本さんなんで、どっちもファンです(^^)

アルファな人のRSSは直接購読しない

http://tdiary.ishinao.net/20060614.html#p01
つうわけで、blogmapのいしかわさんの日記を巡回することにしよう。
まずは過去ログを熟読ですね(^^;


確かに。
今は、はてブ全体のランキングをRSSで読んでニュースソースにしてますが、
それだと、あまりに一般的で、時間的にも遅い情報ばかりに……
結局、信頼できるブックマークを持つ個人さんのRSSを複数読んで、
それで数を計算したほうがいいのかも。
それだと、結局は、ソーシャルブックマークではなくて、
従来の個人ニュースサイトと同じではないか。
URLを直接見ていたのが、RSSを見るようになっただけじゃん orz

西尾維新『DEATH NOTE』『xxxHOLiC』が各ネット書店で予約開始

http://d.hatena.ne.jp/oroshi/20060626/p1
ニュースソース


 おなじノベライズでも西尾維新みたいな名前があると読んでみたくなる感じがするのが
 ちょっと変ですかね。なんか知らずにラノベ作家と文学の間に差別心を感じている?


誰か今のライトノベル界をどうにかしてくれ
http://d.hatena.ne.jp/kurosakiion/20060621
ニュースソース


 ラノベ批判者を、嫌いなら無視すればいいと、批判するのも勝手は勝手と思うんですよ。
 そもそもエンタメは暇つぶしで読んでるだけで、すぐ忘れるし、というのも解る。
 なんでもご馳走だとおなかを壊すというのも解ります。
 (でも、ご馳走って食べてるのかな? その場合のご馳走とは? ドフトエフスキーとか?)
 ただ、自分が好きだったころのライトノベルと、今はあまり違いすぎる気持ちは消えない。
 それは自分が好きだったころは20代だったけど、今は30代半ばというのもあるだろう。
 パクリいいです。焼きなおしいいでしょう。キャラクター小説の書き方なんてそのものだし。
 そういえば、SFにもパルプマガジン乱造で、その後、スペースオペラブームの退潮をきっかけに
 SFそのものが冬になった歴史がありますよね。
 エロは永遠かもしれんけど。
 しかし、最近の中高生は、なんでわざわざ小説なんか読みますかね? マンガがつまらないから?
 それだけが謎。
 自分が中高生のときは、マンガも読んだ上で、小説も面白ければ読んだけど。


 そういえば、乙一のうしなわれる物語(タイトルうろ覚え)が文庫落ちになったみたいですね。角川文庫。

まんがタイムきらら作品初のアニメ化作品が誕生する模様

http://d.hatena.ne.jp/SweetPotato/20060625/1151243444
ニュースソース


 トリコロじゃないのが皮肉ですが。
 最近の無印きららは酷いことになってるらしいですね。4コマのスレでそういううわさだったので……
 最近は単行本しか買わないので動向はわかりませんが……
 最近はアニメになっても、「とってもひどい」場合があるので、むしろクビを絞めることもあるので、
 あまり喜べない場合もありますね。
 ハルヒって正直小説は二巻を読みたいとは思わなかった。マンガもふーん( ´_ゝ`)って感じ。
 アニメでブームが来たのは、アニメがいいからってことはあるんでしょうね。
 なんにせよ京都アニメーションでしたっけ? ここが優れてるんだと思う。
 フルメタルパニックふもっふとか、いかにも受けそうだもん。
 (そういう意味で、星界京都アニメーションにアニメ化して欲しかった。Gainaxではもうだめっぽいので)

機械化ニュースの動向 - みさきニュース2.0開発室

 BLOGで言及する道具に使いやすいように、「もっと見る」の詳細画面には
 記事タイトル URLの組で表示してます。コピペするだけで貼れるようになってます。
 (このへんはmisakidexと同じ)


ニュースとかBLOG検索の自動化とかそのへんの動向をしらべてみました。

http://www.digg.com/
slashdotを皮肉ってるサイトみたいですね。
編集部が投入したニュースに、不特定多数がコメントするシステムは「もう古い」ということを
示しているようで。
不特定多数が、投下したニュースを、不特定多数がVOTEして、評価すると。
はてブと同じソーシャルブックマークですね)
そう考えると、2chのニュース速報は、限られた記者が投下したニュースに皆がコメントしてリコメンドするので、
slashdot型ですね。
違うのが、GoogleNews。機械が投下して、機械がリコメンドする(ユーザーのクリック閲覧数も評価するだろうけど)

そう考えると、
ニュースサイトとは、
slashdot型、digg型、GoogleNews型の三種類があるんだと思う
(従来のニュースサイトを入れると4種類か。もっともcnetみたいにトラックバックできるとslashdot型に近づく)

http://www.technorati.jp/
 完成度が高いですね。技術に特化してるのがいいのかも
カテゴリフィルターがありますね。どういう方法でぶんるいしてるんだろ?

http://wadaino.jp/

 ECアフリエィトに特化してる感じですけど、マスコミ受けが良さそう。
 商品が写真で入りでどばーんとあると、いんぱくとがありますね。
 クロール数が1千万くらすなので、サーバーがたいへんそう。チームで開発されてるみたいですが

http://www.1470.net/bm/
いしなおさんの日記を読んでいると、blogmap型のサービスも増えてきたので、
同じことをやっても仕方ないみたいな記述もありました。
NEXT版を実験されてる模様(tagを考慮されている)

http://del.icio.us/

digg型ですね

  • Newslink Wikiβ版

http://wiki.livedoor.jp/newslink/

wiki上で、記事タイトルを利用して、分類されている模様。
これは「みさきニュース」と近いかも。分類の粒度が自分の方が細かいけど。



今後、必要なのは

  • 同じ記事を「字面」をみて判断するエンジン(GoogleNewsみたいに)
  • blogで被リンクされているURLの数をカウントするエンジン(せかいのまんなかみたいに)

 この二つを活用すれば、同じようなタイトルの記事をまとめつつ、言及が多いURLをのランキングができる。

  • tagの活用

 本来、日本語はとくにそうだけど、tagをやろうと思うと、人間に登録してもらわないと無理。
 固有名詞は、茶筅とかでは分割できない。
 ということで、どこかのBLOGサービスからtagはもらってこないといけないわけです。
 (テクノラティも、ココログとかはてなとかそれぞれのBLOGシステムの書き手のカテゴリを取得している様子)


あと、見せ方が、自分は一枚に圧縮して納めるのは好きなんだけど、世間は
基本がランキングで、カテゴリはタブで切り替えるのが一般的なんで、そのGUIも作ろうと思う。
あと、流行のtag cloudですね。


あと、id:streakeagleさんのコメントにありましたが、
ニュースソースを手繰れるやり方。
これって結局、どこが一番初めに言及したかということで、タイムスタンプで判断するしかないかも。
個人ニュースサイトは引用元も書くけど、RSSとしてルールがあるわけでもないし。
RSSをシステムで出してるBLOGなら、時間で判断すれば、誰がネタもとかはわかるけど、
絶対ではないし。
むかしやってたmisakidexだと、ニュースソースを時間の順に並べてたんで、
一応、ネタ元の順番がわかったけど、巡回先がつねにネタ元と限らないですしね。
これが、digg型だと、投稿者のidが出るので、投稿したあとに閲覧数が伸びる
投稿者のモチベーションになる、任天堂いわく「やる気のスパイラル」を生んでいる。
しかし、このへんの話って、artifactのかのせさんといっしょにやっていた、ニュース投稿サイトで話し合ってたことを
そのままdiggにやられたって感じ(自分的には、連邦のゲットニュースが、digg型の元祖じゃないかと思うけど)
いちいちdigg(VOTE)させないでも、記事をクリックして閲覧した数でカウントしてもいいと思うのだけど。
明示的にVOTEさせることに意味があるのかもしれない。心理学的に。

ユーザーの嗜好を自動学習

http://d.hatena.ne.jp/todesking/20060622/p1

この方向も面白いですね。スゴ録(というかCoCoonというかTiVo)が、ユーザーの好きなTV番組を学習するように
もう製品でも実装されてますね。
ユーザーを認証して、ユーザーごとにサービスを提供するという方向もあると思うんだけど
ちょっと自分は荷が重いなあ。面倒くさがりなので、基本的に自分が欲しいものが欲しいので。
認証だけ肩代わりでやってくれてIDだけくれるサービスもあるのはありますねー


しかし、究極の目標は会話ですよねー!
ニュースが分類できて、嗜好を学習してくれて、面白い物を集合知を利用して探してくれて、
検索してくれて、
でも、その先は、はてな人力検索の回答レベルのことを「機械がしてくれる」ようになって、
さらにその先は、会話ができる。おしゃべりができる機械の実現。これが人類の究極目標。
いや、人工無能ではなくて、ときメモでもなくて。