Hadoop座談会(第5回）に参加しました

こんにちは。落合です。

Hadoopを中心とした分散環境での開発方法論・モデリング・設計手法等についての座談会(第5回）
に参加してきました。関係者の方々、ありがとうございました。
Togetter： 2011/06/29_Hadoop〜座談会(第5回） #hadoopmodeling

講演内容が
「鉄道システムへの誘い」
「九州電力におけるHadoopの取り組みについて」

と、うちが関る鉄道と電力だったため、
これは参加するしかないと思い、
3名で乗りこんできました。

鉄道システムについては、
ここでしか聞けない、匿名での貴重な講演でした。

九州電力の技術的取り組みが先進的なことにも驚きましたが、
それより気になったのが、
亜希さんですね。

目が離せません！

鉄道システムへの誘い

【特徴】
開発期間：数年〜5年
規模　　：最大で10Mステップ、10k人月
特徴　　：開発工数の半分は試験。異常系の試験が多い
耐用年数：10年

ポイントとなるのは、
開発を始めてからシステムの寿命を迎えるまで、
15年もあること。

取り入れる技術やミドルウェアの選定に相当気を配るそうです。

特に商用の製品は、コスト以上に
　サポートが切れないか？
を重視するそうです。

オープンソースは、最悪自分たちで直せばよい、ということなので、
まだないそうですが、Hadoopも鉄道系システムに今後取り入れられる可能性はありますね。

　輸送計画（様々な条件を考慮したダイヤの作成）
　運行管理（遅延に対する対処など、日々の調整）
のシステムの特徴など、コアな話を聞けました。

実は、これらを詳しく解説している書籍があるらしいです。
鉄道ファンなら読むしかない？

九州電力におけるHadoopの取り組みについて

九州電力では、部門ごとにバラバラなシステムを導入している状態。
保守コスト増大への対処のため、
OSSの検証を平成21年から実施。

平成21年
　10台の物理サーバ上に110台の仮想サーバを構築し、そのうえでHadoopを動かした。
　台数の増加によるスケールアウト、耐障害性の試験など、一通りを試した。
　RabbitMQの検証も。

平成22年
　分散に特化し、本番システムへの適用可能性を検証。
　実運用データを元にしたダミーデータの処理で、
　バッチ処理の大幅な性能向上が図れることを確認：
　　MySQLに入っているデータに対するバッチ処理に15日かかるところが、
　　物理サーバ2台上の10仮想OS上でMapReduceで処理して30分で完了
　　（現行システムでは、19時間かかっているらしい）

　運用監視基盤として使っていたのが、
　今のEC-Oneの製品であるMonkey Magic。

平成23年
　仮想サーバの割り当てについての検証などを実施。
　そしてASAKUSAの導入。
　開発コストが3分の1になる見込みだとか。

面白いですね。
他の電力会社はどうなのでしょうか？
と気になったり。

ところで

先日うちのホームページで公開した、
Clouderaの"Hadoop As The Platform For The Smartgrid At TVA"日本語訳スライド、
見たと言う人が結構いました。

日本にスマートグリッドを！という考えで、広く日本の関係者に知ってもらいたいと思い、
訳させてもらったものなので、反響が大きいのはうれしいですね。

それではまた。

Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

Hadoop座談会(第5回）に参加しました

鉄道システムへの誘い

九州電力におけるHadoopの取り組みについて

ところで