1 月 2009

You are currently browsing the monthly archive for 1 月 2009.

以前からマリーチではほぼ毎月、「公開アイデア」と題してサービスのアイデアを公開しています。
時間的、リソース的な問題で開発運営しきれないアイデアをアウトプットしていこうという試みです。
今月のアイデアは「勝手アワード」と「匿名インタビュー」です。
よろしければご意見などお寄せください。

いつもはアイデアの内容だけを公開するのですが、「勝手アワード」の話をしていて、ちょっと作ってみようかということになり、開発をしてみました。

勝手アワード

特に興味深い機能などはないのですが、雰囲気は伝わるかと思います。ちゃんと動きますので、ご自由にお使いください。

かなりシンプルなアプリケーションなので、仕様を考えながらプログラムのベースを作るのに一日、表示を整えたり細かい動作を調整するのに一日、で完成しました。
ロゴの作成にはLogogenerador.com - Generador de Logos web 2.0 Online、ボタン作成にボタン素材 自動生成サイト - ButtonMaker、一部素材に無料素材倶楽部|商用利用・加工可ホームページ フリー画像集を使わせていただきました。
その上でサーバにセットアップします。

ちょっと前まではサービスを公開するために、専用サーバやVPSをレンタルすると、使える状態になるまでに数日かかっていました。
その後、Amazon EC2などを使えば、自前の設備を持っていなくてもオンデマンドでサーバを用意できるようになりました。
しかし、新規構成でサーバをセットアップする作業には、最小構成でも一日近くかかります。(最小構成とはいえ、その後の拡張などもちょっとは考えます。)
昨年四月にGoogleが提供しはじめたGoogle App Engineを使えば、サーバの操作に手を出せない反面、セットアップの手間が全く不要という利点があります。
コマンド一発で(Mac用のLauncherを使えばボタン一発で)本番環境へのアプリケーションセットアップが終わってしまいます。

サーバを操作できないことや、容量制限など、いくつかの壁はありますが、勝手アワードのような、ちょっと作ってみようというものの場合、Google App Engineは最適な選択肢だということが分かります。
容量制限のきついプレビュー版から従量課金制に変われば、そのまま運用し続けていくこともできるのですが、まだもう少しかかるのでしょうか。
今後もちょっとしたものはこのような形で公開していきたいと思います。

Python Code Reading 07

今回も、用賀にあるSun Microsystemsさんのセミナールームにて。
3.0で、標準ライブラリがどう変わったかという内容で、noriさんが講師をされました。
今回参加者は40人を超えたようで、席がいっぱいになっていました。

私は席につくのが少し遅れましたが、最初はPEPという仕様書ごとにPythonの変更点の解説がありました。
その後、ioモジュールとdecimalモジュールのソースコードを読みながらの解説。
両方ともボリュームのあるソースなので、 大変だなーと思って見てました。
概括としては、標準モジュールでさえとりあえず移行という感じで、3.0の新機能を使い切れていない?ということでした。
Function Annotationsなどの機能は自分でも試してみたいと思います。

終わった後は近くのお店で懇親会。
3.0への移行はどうする?というような雑談などしました。
お疲れさまでした。

Users Petition to Save Google Notebook というブログ記事で知りましたが、一部のファンによってGoogleノートブック救済嘆願のための署名が行われているようです。

不況の中、あのGoogleでさえ開発拠点の廃止、採用部門の人員削減など、縮小の動きを見せていますが、先日はいくつかのサービスの停止、開発終了などがアナウンスされました。
その中で、Googleノートブックについては、開発を停止し、新規登録を受け付けないこと、ブラウザの拡張機能は使えなくなることが説明されていました

それを受けて、ユーザー側に署名などの動きが出ているとのことです。ノートブックはGoogleのサービスの中では比較的地味でシンプルなサービスと言っていいと思いますが、機能が豊富なGoogleドキュメントなどよりも、気軽に使えるノートブックを好む人も少数かもしれないですがいるのでしょう。実は私の妻も愛用していて、育児の記録などをメモしています。

ノートブックにも共有機能があって、例えば私が妻の育児記録を覗いたり追記したりすることはできますが、誰がどう変更したかといった履歴は管理してくれません。ノートブックはどちらかと言えばメモを貯めていくためのツールで、Wikiに代表されるような情報を整理するための場所ではないようです。その辺りで、限定的な用途での個人的なツールとして以外には展開しづらいところがあるのかもしれません。

サービス全体が止まってしまうわけではないのですが、使っている側とすれば、個人的なメモを書き込んできたサービスが見捨てられてしまうというのは悲しいことかもしれません。

11日はIIR輪講の第18回で、範囲は17章の「階層的クラスタリング」でした。場所は今回も百度さんの会議室でした。
担当の杉本さんが事前に超綺麗な和訳文書を作ってくれていました。

16章で扱われたフラットクラスタリングは構造がはっきりとしていないので、アプリケーションによっては不便な場合があります。
階層型クラスタリングは、フラットクラスタリングよりも処理コストが大きいのですが、そのような場合の選択肢になります。

どうやって階層を作るかですが、トップダウン型とボトムアップ型があります。多くボトムアップ型が使われているそうで、ここでもボトムアップ型を中心に解説されています。
ボトムアップ型は階層的凝集クラスタリング(HAC = Hierarchical agglomerative clustering)と呼ばれます。HACでは、まず個々の文書を一つのクラスタと考え、類似したクラスタ同士のマージを繰り返します。

HACのなかでは類似度の計算方法がいくつかあります。

  • 単連結 - 最も近い文書同士の距離をクラスタの距離とする
  • 完全連結 - 最も遠い文書同士の距離をクラスタの距離とする
  • 群平均 - クラスタ間の全文書対の距離を平均し、クラスタの距離とする
  • 重心 - クラスタの重心同士の距離をクラスタの距離とする

単連結や完全連結ではクラスタに偏りができる場合があり、重心クラスタリングは性質上扱いづらい部分があるということで、多くのアプリケーションにとっては群平均が最適なアルゴリズムのようです。
HACのアルゴリズムは疑似コードで詳しく紹介されていたので、実践的に使える章だと思います。

他にはフラットクラスタリングを応用しながらトップダウンでクラスタに分解する方法や、特徴語抽出によるクラスタへのラベル付けなどが軽く紹介されていました。

輪講の中では、ただビジュアル化してもつまらないよね、という話も出ました。構造をいかにエンドユーザーのニーズに合うように見せるかというのは、違う頭の使い方をしないといけないですね。

再スタート

遅くなりましたが2009年一つめの投稿です。今年もよろしくお願いいたします。

昨年は色々と勉強になることがあり、中途半端にしてしまったことも多かった一年でした。今年こそは、日本中、いや世界中の人に愛されるような製品を作りだし、マリーチをブレークさせたいと思います!

今、言うまでもなく世界が劇的な変化を迎えていますが、この大変な年にマリーチという場所で勝負できることを感謝しつつ、またそのおもしろさを味わいながら、日々の仕事に取り組んでいきたいと思います。

さてさて、いきなり小さな話になりますけれども、今までのブログは使いづらいところがあったので、WordPressに入れ替えてこのブログの再スタートを切ることにしました。RSSのURLなどが変わってしまったので、RSSリーダーなどに登録していただいていた方は再登録をお願いします。恐縮です。

以前の画像などが移行しきれていないので、その辺はぼちぼちやっていきます。